Milvus est une base de données vectorielles évolutive open-source
La recherche de données à l'aide de critères faciles à définir, par exemple l'interrogation d'une base de données de films par acteur, réalisateur, genre ou date de sortie, est simple. Une base de données relationnelle est bien équipée pour ces types de recherches de base en utilisant un langage de requête tel que SQL. Mais lorsque les recherches portent sur des objets complexes et des requêtes plus abstraites, comme la recherche d'une bibliothèque de vidéos en streaming à l'aide d'un langage naturel ou d'un clip vidéo, les mesures de similarité simples, comme la correspondance des mots dans un titre ou une description, ne sont plus suffisantes.
L'intelligence artificielle (IA) a rendu les ordinateurs beaucoup plus capables de comprendre la sémantique du langage et d'aider les gens à donner un sens à des ensembles de données non structurées massives et difficiles à analyser (par exemple, des données audio, vidéo, des documents et des données de médias sociaux). L'IA permet à Netflix de créer des moteurs de recommandation de contenu sophistiqués, aux utilisateurs de Google de faire des recherches sur le web par image et aux entreprises pharmaceutiques de découvrir de nouveaux médicaments.
Le défi de la recherche dans de grands ensembles de données non structurées
Ces prouesses technologiques sont réalisées à l'aide d'algorithmes d'IA qui convertissent des données denses et non structurées en vecteurs, un format de données numériques facilement lisible par les machines. Ensuite, d'autres algorithmes sont utilisés pour calculer la similarité entre les vecteurs pour une recherche donnée. La grande taille des ensembles de données non structurées fait que la recherche dans leur intégralité prend beaucoup trop de temps pour la plupart des applications d'apprentissage automatique. Pour remédier à ce problème, des algorithmes ANN (approximate nearest neighbor) sont utilisés pour regrouper les vecteurs similaires, puis pour ne rechercher que la partie de l'ensemble de données la plus susceptible de contenir des vecteurs similaires au vecteur de recherche cible.
Cela permet une recherche de similarités beaucoup plus rapide (bien que légèrement moins précise) et est essentiel à la création d'outils d'intelligence artificielle utiles. Grâce aux vastes ressources publiques, il n'a jamais été aussi facile et économique de créer des applications d'apprentissage automatique. Cependant, la recherche de similarités vectorielles alimentée par l'IA nécessite souvent l'entrelacement de différents outils dont le nombre et la complexité varient en fonction des exigences spécifiques du projet. Milvus est un moteur de recherche d'IA open-source qui vise à simplifier le processus de création d'applications d'apprentissage automatique en fournissant des fonctionnalités robustes dans le cadre d'une plateforme unifiée.
Qu'est-ce que Milvus ?
Milvus est une plateforme de gestion de données open-source conçue spécifiquement pour les données vectorielles massives et la rationalisation des opérations d'apprentissage automatique (MLOps). Alimenté par Facebook AI Similarity Search (Faiss), Non-Metric Space Library (NMSLIB) et Annoy, Milvus rassemble une variété d'outils puissants en un seul endroit tout en étendant leurs fonctionnalités autonomes. Le système a été conçu pour stocker, traiter et analyser de grands ensembles de données vectorielles, et peut être utilisé pour construire des applications d'intelligence artificielle couvrant la vision par ordinateur, les moteurs de recommandation, et bien plus encore.
Blog_Milvus est un moteur de recherche open-source évolutif pour l'IA_1.jpg
Milvus a été conçu pour permettre la recherche de similarités vectorielles.
Milvus a été conçu pour être flexible, permettant aux développeurs d'optimiser la plateforme pour leur cas d'utilisation spécifique. La prise en charge du CPU/GPU uniquement et de l'informatique hétérogène permet d'accélérer le traitement des données et d'optimiser les besoins en ressources pour n'importe quel scénario. Les données sont stockées dans Milvus sur une architecture distribuée, ce qui facilite la mise à l'échelle des volumes de données. Grâce à la prise en charge de divers modèles d'IA, langages de programmation (par exemple, C++, Java et Python) et types de processeurs (par exemple, x86, ARM, GPU, TPU et FPGA), Milvus offre une grande compatibilité avec une grande variété de matériels et de logiciels.
Pour plus d'informations sur Milvus, consultez les ressources suivantes :
- Explorez la documentation technique de Milvus et apprenez-en plus sur le fonctionnement interne de la plateforme.
- Apprenez à lancer Milvus, à créer des applications et bien plus encore à l'aide des didacticiels Milvus.
- Contribuer au projet et s'engager avec la communauté open-source de Milvus sur GitHub.
Try Managed Milvus for Free
Zilliz Cloud is hassle-free, powered by Milvus and 10x faster.
Get StartedLike the article? Spread the word