Cómo crear 4 aplicaciones de IA populares con Milvus
portada blog.png
Milvus es una base de datos vectorial de código abierto. Admite la adición, eliminación, actualización y búsqueda casi en tiempo real de conjuntos de datos vectoriales masivos creados mediante la extracción de vectores de características a partir de datos no estructurados utilizando modelos de IA. Con un amplio conjunto de API intuitivas y compatibilidad con múltiples bibliotecas de índices ampliamente adoptadas (por ejemplo, Faiss, NMSLIB y Annoy), Milvus acelera el desarrollo de aplicaciones de aprendizaje automático y las operaciones de aprendizaje automático (MLOps). Con Milvus, puede desarrollar rápidamente un producto mínimo viable (MVP) manteniendo los costes en los límites más bajos.
"¿Qué recursos están disponibles para desarrollar una aplicación de IA con Milvus?" es una pregunta habitual en la comunidad Milvus. Zilliz, la empresa que está detrás de Milvus, ha desarrollado una serie de demos que aprovechan Milvus para realizar búsquedas de similitud a la velocidad del rayo que potencian las aplicaciones inteligentes. El código fuente de las soluciones Milvus puede encontrarse en zilliz-bootcamp. Los siguientes escenarios interactivos muestran el procesamiento del lenguaje natural (PLN), la búsqueda inversa de imágenes, la búsqueda de audio y la visión por ordenador.
No dude en probar las soluciones para adquirir experiencia práctica con escenarios específicos. Comparta sus propios escenarios de aplicación a través de:
Ir a:
- Procesamiento del lenguaje natural (chatbots)
- Búsqueda inversa de imágenes
- Búsqueda de audio
- Detección de objetos de vídeo (visión por ordenador)
Procesamiento del lenguaje natural (chatbots)
Milvus puede utilizarse para crear chatbots que utilicen el procesamiento del lenguaje natural para simular un operador en directo, responder preguntas, dirigir a los usuarios a la información pertinente y reducir los costes de mano de obra. Para demostrar este escenario de aplicación, Zilliz construyó un chatbot impulsado por IA que entiende el lenguaje semántico combinando Milvus con BERT, un modelo de aprendizaje automático (ML) desarrollado para el pre-entrenamiento NLP.
👉Source code:zilliz-bootcamp/intelligent_question_answering_v2
1.png
Cómo utilizarlo
Cargue un conjunto de datos que incluya pares pregunta-respuesta. Formatee las preguntas y respuestas en dos columnas separadas. También puede descargar un conjunto de datos de ejemplo.
Una vez introducida la pregunta, se obtendrá una lista de preguntas similares a partir del conjunto de datos cargado.
Revele la respuesta seleccionando la pregunta más similar a la suya.
👉Video:[Demo] Sistema QA desarrollado por Milvus
Cómo funciona
Las preguntas se convierten en vectores de características utilizando el modelo BERT de Google y, a continuación, se utiliza Milvus para gestionar y consultar el conjunto de datos.
Procesamiento de datos:
- BERT se utiliza para convertir los pares pregunta-respuesta cargados en vectores de características de 768 dimensiones. A continuación, los vectores se importan a Milvus y se les asignan identificadores individuales.
- Los ID de los vectores de preguntas y respuestas correspondientes se almacenan en PostgreSQL.
Búsqueda de preguntas similares:
- BERT se utiliza para extraer vectores de características de la pregunta de entrada de un usuario.
- Milvus recupera los vectores ID de las preguntas más similares a la pregunta de entrada.
- El sistema busca las respuestas correspondientes en PostgreSQL.
Sistemas de búsqueda inversa de imágenes
La búsqueda inversa de imágenes está transformando el comercio electrónico a través de recomendaciones personalizadas de productos y herramientas similares de búsqueda de productos que pueden impulsar las ventas. En este escenario de aplicación, Zilliz construyó un sistema de búsqueda inversa de imágenes combinando Milvus con VGG, un modelo ML que puede extraer características de imágenes.
👉Código fuente:zilliz-bootcamp/image_search
2.jpeg
Cómo utilizarlo
- Cargue un conjunto de datos de imágenes comprimido compuesto únicamente por imágenes .jpg (no se aceptan otros tipos de archivos de imagen). También puede descargar un conjunto de datos de muestra.
- Cargue una imagen para utilizarla como entrada de búsqueda para encontrar imágenes similares.
👉Video: [Demo] Búsqueda de imágenes con Milvus
Cómo funciona
Las imágenes se convierten en vectores de características de 512 dimensiones utilizando el modelo VGG y, a continuación, se utiliza Milvus para gestionar y consultar el conjunto de datos.
Procesamiento de datos:
- El modelo VGG se utiliza para convertir el conjunto de datos de imágenes cargado en vectores de características. A continuación, los vectores se importan a Milvus y se les asignan ID individuales.
- Los vectores de características de las imágenes y las rutas de los archivos de imagen correspondientes se almacenan en CacheDB.
Búsqueda de imágenes similares:
- VGG se utiliza para convertir la imagen cargada por un usuario en vectores de características.
- Los vectores ID de las imágenes más similares a la imagen de entrada se recuperan de Milvus.
- El sistema busca las rutas de los archivos de imagen correspondientes en CacheDB.
Sistemas de búsqueda de audio
La búsqueda de voz, música, efectos de sonido y otros tipos de audio permite consultar rápidamente grandes volúmenes de datos de audio y encontrar sonidos similares. Las aplicaciones incluyen la identificación de efectos de sonido similares, la minimización de infracciones de la propiedad intelectual, etc. Para demostrar este escenario de aplicación, Zilliz construyó un sistema de búsqueda de similitud de audio altamente eficiente combinando Milvus con PANNs, unared neuronal de audio preentrenada a gran escala construida para el reconocimiento de patrones de audio.
👉Código fuente:zilliz-bootcamp/audio_search 3.png
Cómo utilizarlo
- Cargue un conjunto de datos de audio comprimido compuesto únicamente por archivos .wav (no se aceptan otros tipos de archivos de audio). También puede descargar un conjunto de datos de muestra.
- Cargue un archivo .wav para utilizarlo como entrada de búsqueda para encontrar audio similar.
👉Video: [Demo] Búsqueda de audio con Milvus
Cómo funciona
El audio se convierte en vectores de características utilizando PANNs, redes neuronales de audio pre-entrenadas a gran escala construidas para el reconocimiento de patrones de audio. A continuación, se utiliza Milvus para gestionar y consultar el conjunto de datos.
Procesamiento de datos:
- PANNs convierte el audio del conjunto de datos cargado en vectores de características. A continuación, los vectores se importan a Milvus y se les asignan ID individuales.
- Los ID de los vectores de características de audio y sus correspondientes rutas de archivos .wav se almacenan en PostgreSQL.
Búsqueda de audio similar:
- PANNs se utiliza para convertir el archivo de audio cargado por un usuario en vectores de características.
- Las ID de los vectores de audio más similares al archivo cargado se recuperan de Milvus calculando la distancia del producto interior (PI).
- El sistema busca las rutas de los archivos de audio correspondientes en MySQL.
Detección de objetos en vídeo (visión por ordenador)
La detección de objetos de vídeo tiene aplicaciones en visión por ordenador, recuperación de imágenes, conducción autónoma, etc. Para demostrar este escenario de aplicación, Zilliz construyó un sistema de detección de objetos de vídeo combinando Milvus con tecnologías y algoritmos que incluyen OpenCV, YOLOv3 y ResNet50.
👉Código fuente: zilliz-bootcamp/video_analysis
4.png
Cómo utilizarlo
- Cargue un conjunto de datos de imágenes comprimido compuesto únicamente por archivos .jpg (no se aceptan otros tipos de archivos de imagen). Asegúrese de que cada archivo de imagen lleva el nombre del objeto que representa. También puede descargar un conjunto de datos de muestra.
- Cargue un vídeo para utilizarlo en el análisis.
- Haga clic en el botón de reproducción para ver el vídeo cargado con los resultados de detección de objetos mostrados en tiempo real.
👉Video: [Demo] Sistema de detección de objetos de vídeo con tecnología Milvus
Cómo funciona
Las imágenes de objetos se convierten en vectores de características de 2048 dimensiones utilizando ResNet50. A continuación, se utiliza Milvus para gestionar y consultar el conjunto de datos.
Procesamiento de datos:
- ResNet50 convierte imágenes de objetos en vectores de características de 2048 dimensiones. A continuación, los vectores se importan a Milvus y se les asignan ID individuales.
- Los ID de los vectores de características de audio y sus correspondientes rutas de archivo de imagen se almacenan en MySQL.
Detección de objetos en vídeo:
- OpenCV se utiliza para recortar el vídeo.
- YOLOv3 se utiliza para detectar objetos en el vídeo.
- ResNet50 convierte las imágenes de los objetos detectados en vectores de características de 2048 dimensiones.
Milvus busca las imágenes de objetos más similares en el conjunto de datos cargado. Los nombres de los objetos correspondientes y las rutas de los archivos de imagen se recuperan de MySQL.
Try Managed Milvus for Free
Zilliz Cloud is hassle-free, powered by Milvus and 10x faster.
Get StartedLike the article? Spread the word