Motor de pesquisa de texto para imagem
Este tutorial demonstra como utilizar o Milvus, a base de dados vetorial de código aberto, para criar um motor de pesquisa de texto para imagem.
Pode construir rapidamente um motor de pesquisa texto-imagem mínimo viável seguindo o tutorial básico. Em alternativa, pode também ler o tutorial aprofundado que abrange tudo, desde a seleção de modelos à implementação de serviços. Pode criar um motor de pesquisa de texto para imagem mais avançado que satisfaça as suas necessidades comerciais, seguindo as instruções do tutorial aprofundado.
O modelo ML e o software de terceiros utilizados incluem:
Hoje em dia, os motores de pesquisa de texto tradicionais estão a perder o seu encanto, com cada vez mais pessoas a recorrerem ao TikTok como o seu motor de pesquisa preferido. Durante uma pesquisa de texto tradicional, as pessoas introduzem palavras-chave e são-lhes mostrados todos os textos que contêm a palavra-chave. No entanto, as pessoas queixam-se de que nem sempre conseguem encontrar o que pretendem numa pesquisa deste tipo. Para além disso, os resultados não são suficientemente intuitivos. As pessoas dizem que consideram as imagens e os vídeos muito mais intuitivos e agradáveis do que ter de percorrer linhas de texto. O motor de pesquisa multimodal de texto para imagem surgiu como resultado. Com este novo tipo de motor de busca, as pessoas podem encontrar imagens relevantes introduzindo um pedaço de texto com algumas palavras-chave.
Neste tutorial, aprenderá a construir um motor de pesquisa de texto para imagem. Este tutorial utiliza o modelo CLIP para extrair caraterísticas de imagens e convertê-las em vectores. Em seguida, estes vectores de imagens são armazenados na base de dados de vectores Milvus. Quando os utilizadores introduzem textos de consulta, estes textos são também convertidos em vectores de incorporação utilizando o mesmo modelo ML CLIP. Posteriormente, é efectuada uma pesquisa de semelhança de vectores no Milvus para obter os vectores de imagens mais semelhantes ao vetor de texto de entrada.
Pesquisa_de_imagem_de_texto