milvus-logo
LFAI
Home
  • Tutoriais

Classificação de seqüências de DNA

Este tutorial demonstra como usar o Milvus, o banco de dados de vetores de código aberto, para criar um modelo de classificação de sequência de DNA.

O modelo ML e o software de terceiros utilizados incluem:

  • CountVectorizer
  • MySQL
  • Towhee


A sequência de ADN é um conceito popular na rastreabilidade de genes, identificação de espécies, diagnóstico de doenças e muitas outras áreas. Enquanto todas as indústrias anseiam por um método de investigação mais inteligente e eficiente, a inteligência artificial tem atraído muita atenção, especialmente nos domínios biológico e médico. Cada vez mais cientistas e investigadores estão a contribuir para a aprendizagem automática e a aprendizagem profunda no domínio da bioinformática. Para tornar os resultados experimentais mais convincentes, uma opção comum é aumentar o tamanho da amostra. A colaboração com grandes volumes de dados em genómica traz mais possibilidades de aplicação na realidade. No entanto, o alinhamento tradicional de sequências tem limitações, o que o torna inadequado para grandes conjuntos de dados. A fim de reduzir as desvantagens na realidade, a vectorização é uma boa escolha para um grande conjunto de dados de sequências de ADN.


Neste tutorial, aprenderá a construir um modelo de classificação de sequências de ADN. Este tutorial utiliza o CountVectorizer para extrair caraterísticas das sequências de ADN e convertê-las em vectores. Em seguida, estes vectores são armazenados no Milvus e as classes de ADN correspondentes são armazenadas no MySQL. Os utilizadores podem efetuar uma pesquisa de semelhança de vectores no Milvus e recuperar a classificação de ADN correspondente a partir do MySQL.


dna ADN

Traduzido porDeepL

Try Managed Milvus for Free

Zilliz Cloud is hassle-free, powered by Milvus and 10x faster.

Get Started
Feedback

Esta página foi útil?