🚀 Prueba Zilliz Cloud, el Milvus completamente gestionado, gratis—¡experimenta un rendimiento 10 veces más rápido! Prueba Ahora>>

milvus-logo
LFAI
  • Home
  • Blog
  • Presentación de Milvus 2.4: búsqueda multivectorial, vector disperso, índice CAGRA, ¡y mucho más!

Presentación de Milvus 2.4: búsqueda multivectorial, vector disperso, índice CAGRA, ¡y mucho más!

  • Engineering
March 20, 2024
Fendy Feng

Nos complace anunciar el lanzamiento de Milvus 2.4, un importante avance en la mejora de las capacidades de búsqueda de conjuntos de datos a gran escala. Esta última versión añade nuevas funciones, como la compatibilidad con el índice CAGRA basado en GPU, la compatibilidad beta con incrustaciones dispersas, la búsqueda de grupos y otras mejoras en las capacidades de búsqueda. Estos avances refuerzan nuestro compromiso con la comunidad al ofrecer a desarrolladores como usted una herramienta potente y eficaz para manejar y consultar datos vectoriales. Analicemos juntos las principales ventajas de Milvus 2.4.

Búsqueda multivectorial habilitada para búsquedas multimodales simplificadas

Milvus 2.4 proporciona la capacidad de búsqueda multivectorial, permitiendo la búsqueda simultánea y la reordenación de diferentes tipos de vectores dentro del mismo sistema Milvus. Esta función agiliza las búsquedas multimodales, mejorando significativamente las tasas de recuperación y permitiendo a los desarrolladores gestionar sin esfuerzo intrincadas aplicaciones de IA con diversos tipos de datos. Además, esta funcionalidad simplifica la integración y el ajuste de modelos de reordenación personalizados, ayudando a la creación de funciones de búsqueda avanzadas como sistemas de recomendación precisos que utilizan información de datos multidimensionales.

How the Milti-Vector Search Feature Works Cómo funciona la función de búsqueda multivectorial

El soporte multivectorial en Milvus tiene dos componentes:

  1. La capacidad de almacenar/consultar múltiples vectores para una sola entidad dentro de una colección, que es una forma más natural de organizar los datos.

  2. La capacidad de construir/optimizar un algoritmo de reordenación aprovechando los algoritmos de reordenación predefinidos en Milvus.

Además de ser una función muy solicitada, hemos creado esta capacidad porque el sector está avanzando hacia modelos multimodales con el lanzamiento de GPT-4 y Claude 3. La reordenación es una técnica muy utilizada para mejorar el rendimiento de las consultas en las búsquedas. Nuestro objetivo era facilitar a los desarrolladores la creación y optimización de sus reordenadores dentro del ecosistema Milvus.

Soporte de búsqueda agrupada para mejorar la eficiencia computacional

La búsqueda agrupada es otra de las características más solicitadas que hemos añadido a Milvus 2.4. Integra una operación de agrupación diseñada para campos de tipo BOOL, INT, o VARCHAR, llenando un vacío de eficiencia crucial en la ejecución de consultas de agrupación a gran escala.

Tradicionalmente, los desarrolladores dependían de extensas búsquedas Top-K seguidas de un postprocesamiento manual para destilar los resultados específicos de grupo, un método intensivo en computación y pesado en código. La búsqueda de grupos perfecciona este proceso vinculando eficazmente los resultados de las consultas a identificadores de grupos agregados, como nombres de documentos o vídeos, lo que agiliza la gestión de entidades segmentadas dentro de grandes conjuntos de datos.

Milvus distingue su Grouping Search con una implementación basada en iteradores, que ofrece una notable mejora de la eficiencia computacional con respecto a tecnologías similares. Esta elección garantiza una escalabilidad superior del rendimiento, especialmente en entornos de producción en los que la optimización de los recursos informáticos es primordial. Al reducir la sobrecarga computacional y de procesamiento de datos, Milvus soporta un procesamiento de consultas más eficiente, reduciendo significativamente los tiempos de respuesta y los costes operativos en comparación con otras bases de datos vectoriales.

La búsqueda agrupada refuerza la capacidad de Milvus para gestionar consultas complejas de gran volumen y se ajusta a las prácticas informáticas de alto rendimiento para soluciones de gestión de datos sólidas.

Soporte Beta para incrustaciones de vectores dispersos

Las incrustaciones de vectores dispersos representan un cambio de paradigma con respecto a los enfoques tradicionales de vectores densos, ya que tienen en cuenta los matices de la similitud semántica en lugar de la mera frecuencia de palabras clave. Esta distinción permite una capacidad de búsqueda más matizada, en estrecha consonancia con el contenido semántico de la consulta y los documentos. Los modelos de vectores dispersos, especialmente útiles en la recuperación de información y el procesamiento del lenguaje natural, ofrecen potentes capacidades de búsqueda fuera del dominio e interpretabilidad en comparación con sus homólogos densos.

En Milvus 2.4, hemos ampliado la búsqueda híbrida para incluir incrustaciones dispersas generadas por modelos neuronales avanzados como SPLADEv2 o modelos estadísticos como BM25. En Milvus, los vectores dispersos reciben el mismo tratamiento que los vectores densos, lo que permite crear colecciones con campos de vectores dispersos, insertar datos, crear índices y realizar búsquedas de similitud. En particular, las incrustaciones dispersas de Milvus admiten la métrica de distancia del producto interior (IP), lo que resulta ventajoso dada su naturaleza altamente dimensional, que hace que otras métricas sean menos eficaces. Esta funcionalidad también admite tipos de datos con una dimensión como un entero de 32 bits sin signo y un flotante de 32 bits para el valor, lo que facilita un amplio espectro de aplicaciones, desde búsquedas de texto matizadas hasta elaborados sistemas de recuperación de información.

Con esta nueva función, Milvus permite metodologías de búsqueda híbridas que combinan técnicas basadas en palabras clave e incrustaciones, ofreciendo una transición fluida a los usuarios que pasan de marcos de búsqueda centrados en palabras clave a una solución completa y de bajo mantenimiento.

Etiquetamos esta función como "Beta" para seguir probando su rendimiento y recabar comentarios de la comunidad. La disponibilidad general (GA) del soporte de vectores dispersos está prevista para el lanzamiento de Milvus 3.0.

Soporte de índices CAGRA para la indexación avanzada de gráficos acelerada en la GPU

Desarrollada por NVIDIA, CAGRA (Cuda Anns GRAph-based) es una tecnología de indexación de gráficos basada en la GPU que supera con creces los métodos tradicionales basados en la CPU, como el índice HNSW, en eficiencia y rendimiento, especialmente en entornos de alta producción.

Con la introducción del índice CAGRA, Milvus 2.4 proporciona una mayor capacidad de indexación de grafos acelerada por la GPU. Esta mejora es ideal para crear aplicaciones de búsqueda de similitudes que requieran una latencia mínima. Además, Milvus 2.4 integra una búsqueda de fuerza bruta con el índice CAGRA para conseguir las máximas tasas de recuperación en las aplicaciones. Para obtener información detallada, explore el blog de introducción sobre CAGRA.

Milvus Raft CAGRA vs. Milvus HNSW Milvus Raft CAGRA frente a Milvus HNSW

Mejoras y características adicionales

Milvus 2.4 también incluye otras mejoras clave, como la compatibilidad con expresiones regulares para mejorar la coincidencia de subcadenas en el filtrado de metadatos, un nuevo índice escalar invertido para un filtrado eficaz de tipos de datos escalares y una herramienta de captura de datos de cambios para supervisar y replicar los cambios en las colecciones de Milvus. Estas actualizaciones mejoran colectivamente el rendimiento y la versatilidad de Milvus, convirtiéndolo en una solución completa para operaciones de datos complejas.

Para más detalles, consulte la documentación de Milvus 2.4.

Manténgase conectado

¿Quiere saber más sobre Milvus 2.4? Participe en nuestro próximo seminario web con James Luan, Vicepresidente de Ingeniería de Zilliz, para un debate en profundidad sobre las capacidades de esta última versión. Si tiene preguntas o comentarios, únase a nuestro canal de Discord para hablar con nuestros ingenieros y miembros de la comunidad. No olvide seguirnos en Twitter o LinkedIn para conocer las últimas noticias y actualizaciones sobre Milvus.

Like the article? Spread the word

Sigue Leyendo