milvus-logo
LFAI
Home
  • Tutoriales

Motor de búsqueda de texto a imagen

Este tutorial muestra cómo utilizar Milvus, la base de datos vectorial de código abierto, para construir un motor de búsqueda de texto a imagen.

Puede construir rápidamente un motor de búsqueda de texto a imagen mínimamente viable siguiendo el tutorial básico. Alternativamente, también puede leer el tutorial de inmersión profunda que cubre todo, desde la selección del modelo hasta el despliegue del servicio. Puedes crear un motor de búsqueda texto-imagen más avanzado que se adapte a las necesidades de tu empresa siguiendo las instrucciones del tutorial en profundidad.

El modelo ML y el software de terceros utilizados incluyen:

Hoy en día, los motores de búsqueda de texto tradicionales están perdiendo su encanto y cada vez más gente recurre a TikTok como su motor de búsqueda favorito. Durante una búsqueda de texto tradicional, los usuarios introducen palabras clave y se les muestran todos los textos que las contienen. Sin embargo, la gente se queja de que no siempre encuentra lo que quiere en una búsqueda de este tipo. Además, los resultados no son suficientemente intuitivos. La gente dice que las imágenes y los vídeos les resultan mucho más intuitivos y agradables que tener que rastrear líneas de texto. De ahí surgió el motor de búsqueda multimodal texto-imagen. Con este nuevo tipo de motor de búsqueda, la gente puede encontrar imágenes relevantes introduciendo un trozo de texto con algunas palabras clave.

En este tutorial, aprenderás a construir un motor de búsqueda texto-imagen. Este tutorial utiliza el modelo CLIP para extraer características de las imágenes y convertirlas en vectores. A continuación, estos vectores de imágenes se almacenan en la base de datos vectorial Milvus. Cuando los usuarios introducen textos de consulta, estos textos también se convierten en vectores de incrustación utilizando el mismo modelo ML CLIP. Posteriormente, se realiza una búsqueda de similitud vectorial en Milvus para recuperar los vectores de imagen más similares al vector de texto introducido.

Text_image_search Búsqueda_imagen_texto

Traducido porDeepLogo

Feedback

¿Fue útil esta página?