Con qué versión de Milvus empezar
La selección de la versión Milvus adecuada es fundamental para el éxito de cualquier proyecto que aproveche la tecnología de búsqueda vectorial. Con diferentes versiones de Milvus adaptadas a distintos requisitos, comprender la importancia de seleccionar la versión correcta es crucial para lograr los resultados deseados.
La versión correcta de Milvus puede ayudar a un desarrollador a aprender y crear prototipos rápidamente o ayudar a optimizar la utilización de recursos, agilizar los esfuerzos de desarrollo y garantizar la compatibilidad con la infraestructura y las herramientas existentes. En última instancia, se trata de mantener la productividad del desarrollador y mejorar la eficacia, la fiabilidad y la satisfacción del usuario.
Versiones disponibles de Milvus
Hay tres versiones de Milvus disponibles para los desarrolladores, y todas son de código abierto. Las tres versiones son Milvus Lite, Milvus Standalone y Milvus Cluster, que difieren en características y en cómo los usuarios planean utilizar Milvus a corto y largo plazo. Explorémoslas individualmente.
Milvus Lite
Como su nombre indica, Milvus Lite es una versión ligera que se integra perfectamente con Google Colab y Jupyter Notebook. Está empaquetado como un único binario sin dependencias adicionales, lo que hace que sea fácil de instalar y ejecutar en su máquina o incrustar en aplicaciones Python. Además, Milvus Lite incluye un servidor independiente Milvus basado en CLI, proporcionando flexibilidad para ejecutarlo directamente en su máquina. El hecho de incrustarlo en su código Python o utilizarlo como servidor independiente depende totalmente de sus preferencias y de los requisitos específicos de su aplicación.
Características y capacidades
Milvus Lite incluye todas las características principales de búsqueda vectorial de Milvus.
Capacidades de búsqueda: Admite búsquedas top-k, de rango e híbridas, incluido el filtrado de metadatos, para satisfacer diversos requisitos de búsqueda.
Tipos de índices y métricas de similitud: Ofrece soporte para 11 tipos de índices y cinco métricas de similitud, proporcionando flexibilidad y opciones de personalización para su caso de uso específico.
Procesamiento de datos: Permite el procesamiento por lotes (Apache Parquet, Arrays, JSON) y en flujo, con una integración perfecta a través de conectores para Airbyte, Apache Kafka y Apache Spark.
Operaciones CRUD: Ofrece soporte completo CRUD (crear, leer, actualizar/upsertar, eliminar), facultando a los usuarios con capacidades integrales de gestión de datos.
Aplicaciones y limitaciones
Milvus Lite es ideal para la creación rápida de prototipos y el desarrollo local, ofreciendo soporte para la configuración rápida y la experimentación con conjuntos de datos a pequeña escala en su máquina. Sin embargo, sus limitaciones se hacen evidentes al pasar a entornos de producción con conjuntos de datos más grandes y requisitos de infraestructura más exigentes. Por ello, aunque Milvus Lite es una herramienta excelente para la exploración y las pruebas iniciales, puede no ser adecuada para desplegar aplicaciones en entornos de gran volumen o listos para la producción.
Recursos disponibles
Milvus autónomo
Milvus ofrece dos modos operativos: Standalone y Cluster. Ambos modos son idénticos en cuanto a las características básicas de la base de datos vectorial y difieren en cuanto al tamaño de los datos y los requisitos de escalabilidad. Esta distinción le permite seleccionar el modo que mejor se ajuste al tamaño de su conjunto de datos, volumen de tráfico y otros requisitos de infraestructura para la producción.
Milvus Standalone es un modo de funcionamiento para el sistema de base de datos vectorial de Milvus en el que funciona de forma independiente como una única instancia sin ninguna agrupación o configuración distribuida. Milvus se ejecuta en un único servidor o máquina en este modo, proporcionando funcionalidades como la indexación y la búsqueda de vectores. Es adecuado para situaciones en las que la escala de volumen de datos y tráfico es relativamente pequeña y no requiere las capacidades distribuidas que proporciona una configuración en clúster.
Características y capacidades
Alto rendimiento: Realice búsquedas vectoriales en conjuntos de datos masivos (miles de millones o más) con una velocidad y eficacia excepcionales.
Capacidades de búsqueda: Admite búsquedas top-k, de rango e híbridas, incluido el filtrado de metadatos, para satisfacer diversos requisitos de búsqueda.
Tipos de índices y métricas de similitud: Ofrece soporte para 11 tipos de índices y 5 métricas de similitud, proporcionando flexibilidad y opciones de personalización para su caso de uso específico.
Procesamiento de datos: Permite el procesamiento tanto por lotes (Apache Parquet, Arrays, Json) como por flujos, con una integración perfecta a través de conectores para Airbyte, Apache Kafka y Apache Spark.
Replicación de datos y conmutación por error: Las funciones integradas de replicación y failover/failback garantizan la integridad de los datos y la disponibilidad de la aplicación, incluso durante interrupciones o fallos.
Escalabilidad: Consiga escalabilidad dinámica con escalado a nivel de componentes, lo que permite un escalado ascendente y descendente sin interrupciones en función de la demanda. Milvus puede autoescalar a nivel de componente, optimizando la asignación de recursos para mejorar la eficiencia.
Arrendamiento múltiple: Soporta multi-tenancy con la capacidad de gestionar hasta 10.000 colecciones/particiones en un cluster, proporcionando una utilización eficiente de los recursos y aislamiento para diferentes usuarios o aplicaciones.
Operaciones CRUD: Ofrece soporte completo CRUD (crear, leer, actualizar/upsertar, eliminar), facultando a los usuarios con capacidades integrales de gestión de datos.
Componentes esenciales:
Milvus: El componente funcional central.
etcd: El motor de metadatos responsable de acceder y almacenar metadatos de los componentes internos de Milvus, incluyendo proxies, nodos de índice y más.
MinIO: El motor de almacenamiento responsable de la persistencia de datos dentro de Milvus.
Figura 1: Arquitectura independiente de Milvus
Recursos disponibles
Documentación
Milvus Cluster
Milvus Cluster es un modo de operación para el sistema de base de datos vectorial Milvus donde opera y se distribuye a través de múltiples nodos o servidores. En este modo, las instancias de Milvus se agrupan para formar un sistema unificado que puede manejar mayores volúmenes de datos y mayores cargas de tráfico en comparación con una configuración independiente. Milvus Cluster ofrece características de escalabilidad, tolerancia a fallos y equilibrio de carga, lo que lo hace adecuado para escenarios que necesitan manejar grandes volúmenes de datos y servir muchas consultas concurrentes de forma eficiente.
Características y capacidades
Hereda todas las funciones disponibles en Milvus Standalone, incluida la búsqueda vectorial de alto rendimiento, la compatibilidad con múltiples tipos de índices y métricas de similitud, y la integración perfecta con marcos de procesamiento por lotes y de flujo.
Ofrece una disponibilidad, un rendimiento y una optimización de costes sin precedentes al aprovechar la informática distribuida y el equilibrio de carga en varios nodos.
Permite desplegar y escalar cargas de trabajo seguras y de nivel empresarial con costes totales más bajos mediante la utilización eficiente de los recursos en todo el clúster y la optimización de la asignación de recursos en función de las demandas de la carga de trabajo.
Componentes esenciales:
Milvus Cluster incluye ocho componentes de microservicios y tres dependencias de terceros. Todos los microservicios pueden desplegarse en Kubernetes independientemente unos de otros.
Componentes de microservicio
Coordenada raíz
Proxy
Nodo de consulta
Nodo de consulta
Coordenada de índice
Nodo índice
Coordenada de datos
Nodo de datos
Dependencias de terceros
etcd: Almacena metadatos para varios componentes del clúster.
MinIO: Responsable de la persistencia de datos de archivos de gran tamaño en el clúster, como archivos de índice y de registro binario.
Pulsar: Gestiona los registros de operaciones de mutación recientes, genera registros de flujo y proporciona servicios de publicación y suscripción de registros.
Figura 2: Arquitectura del clúster Milvus
Recursos disponibles
Documentación | Cómo empezar
Tomar la decisión sobre qué versión de Milvus utilizar
Al decidir qué versión de Milvus utilizar para su proyecto, debe considerar factores como el tamaño de su conjunto de datos, el volumen de tráfico, los requisitos de escalabilidad y las limitaciones del entorno de producción. Milvus Lite es perfecto para crear prototipos en su ordenador portátil. Milvus Standalone ofrece un alto rendimiento y flexibilidad para realizar búsquedas vectoriales en sus conjuntos de datos, por lo que es adecuado para implementaciones a menor escala, CI/CD e implementaciones fuera de línea cuando no tiene soporte para Kubernetes... Y, por último, Milvus Cluster ofrece una disponibilidad, escalabilidad y optimización de costes sin precedentes para cargas de trabajo de nivel empresarial, por lo que es la opción preferida para entornos de producción a gran escala y altamente disponibles.
Existe otra versión sin complicaciones, que es una versión gestionada de Milvus llamada Zilliz Cloud.
En última instancia, la versión de Milvus dependerá de su caso de uso específico, requisitos de infraestructura y objetivos a largo plazo. Al evaluar cuidadosamente estos factores y comprender las características y capacidades de cada versión, puede tomar una decisión informada que se alinee con las necesidades y objetivos de su proyecto. Tanto si elige Milvus Standalone como Milvus Cluster, puede aprovechar la potencia de las bases de datos vectoriales para mejorar el rendimiento y la eficiencia de sus aplicaciones de IA.
- Versiones disponibles de Milvus
- Milvus Lite
- Milvus autónomo
- Milvus Cluster
- Tomar la decisión sobre qué versión de Milvus utilizar
On This Page
Try Managed Milvus for Free
Zilliz Cloud is hassle-free, powered by Milvus and 10x faster.
Get StartedLike the article? Spread the word