🚀 Testen Sie Zilliz Cloud, die vollständig verwaltete Milvus, kostenlos – erleben Sie 10x schnellere Leistung! Jetzt testen>>

milvus-logo
LFAI
  • Home
  • Blog
  • Enthüllung von Milvus 2.4: Multivektorsuche, Sparse Vector, CAGRA Index und mehr!

Enthüllung von Milvus 2.4: Multivektorsuche, Sparse Vector, CAGRA Index und mehr!

  • Engineering
March 20, 2024
Fendy Feng

Wir freuen uns, die Einführung von Milvus 2.4 ankündigen zu können, eine bedeutende Weiterentwicklung der Suchfunktionen für große Datensätze. Diese neueste Version bietet neue Funktionen wie Unterstützung für den GPU-basierten CAGRA-Index, Beta-Unterstützung für Sparse Embeddings, Gruppensuche und verschiedene andere Verbesserungen der Suchfunktionen. Mit diesen Entwicklungen unterstreichen wir unser Engagement für die Community, indem wir Entwicklern wie Ihnen ein leistungsstarkes und effizientes Tool für die Verarbeitung und Abfrage von Vektordaten bieten. Lassen Sie uns gemeinsam einen Blick auf die wichtigsten Vorteile von Milvus 2.4 werfen.

Aktivierte Multivektorsuche für vereinfachte multimodale Suchvorgänge

Milvus 2.4 bietet die Möglichkeit der Multivektorsuche, die die gleichzeitige Suche und Neuordnung verschiedener Vektortypen innerhalb desselben Milvus-Systems ermöglicht. Diese Funktion rationalisiert die multimodale Suche, verbessert die Wiederfindungsrate erheblich und ermöglicht es Entwicklern, komplexe KI-Anwendungen mit unterschiedlichen Datentypen mühelos zu verwalten. Darüber hinaus vereinfacht diese Funktionalität die Integration und Feinabstimmung von benutzerdefinierten Reranking-Modellen und hilft bei der Erstellung von fortschrittlichen Suchfunktionen wie präzisen Empfehlungssystemen, die Erkenntnisse aus mehrdimensionalen Daten nutzen.

How the Milti-Vector Search Feature Works So funktioniert die Milti-Vector-Suchfunktion

Die Multivektor-Unterstützung in Milvus hat zwei Komponenten:

  1. Die Fähigkeit, mehrere Vektoren für eine einzelne Entität innerhalb einer Sammlung zu speichern/abzufragen, was eine natürlichere Art ist, Daten zu organisieren

  2. Die Möglichkeit, einen Reranking-Algorithmus zu erstellen/optimieren, indem man die vorgefertigten Reranking-Algorithmen in Milvus nutzt.

Abgesehen davon, dass es sich um eine stark nachgefragte Funktion handelt, haben wir diese Fähigkeit entwickelt, weil sich die Branche mit der Veröffentlichung von GPT-4 und Claude 3 in Richtung multimodaler Modelle bewegt. Reranking ist eine weit verbreitete Technik, um die Leistung von Suchanfragen weiter zu verbessern. Wir wollten es den Entwicklern leicht machen, ihre Reranker innerhalb des Milvus-Ökosystems zu erstellen und zu optimieren.

Unterstützung der gruppierten Suche für verbesserte Rechenleistung

Die Gruppierungssuche ist eine weitere häufig gewünschte Funktion, die wir zu Milvus 2.4 hinzugefügt haben. Sie integriert eine Group-by-Operation für Felder der Typen BOOL, INT oder VARCHAR und schließt damit eine entscheidende Effizienzlücke bei der Ausführung umfangreicher Gruppierungsabfragen.

Traditionell verließen sich Entwickler auf umfangreiche Top-K-Suchen, gefolgt von manueller Nachbearbeitung, um gruppenspezifische Ergebnisse zu destillieren - eine rechenintensive und codelastige Methode. Grouping Search verfeinert diesen Prozess durch die effiziente Verknüpfung von Abfrageergebnissen mit aggregierten Gruppenkennungen wie Dokument- oder Videonamen, was die Handhabung von segmentierten Entitäten innerhalb größerer Datensätze vereinfacht.

Milvus zeichnet sich bei der Grouping Search durch eine Iterator-basierte Implementierung aus, die im Vergleich zu ähnlichen Technologien eine deutliche Verbesserung der Berechnungseffizienz bietet. Diese Wahl gewährleistet eine überragende Skalierbarkeit der Leistung, insbesondere in Produktionsumgebungen, in denen die Optimierung der Rechenressourcen von größter Bedeutung ist. Durch die Reduzierung der Datenüberquerung und des Berechnungs-Overheads unterstützt Milvus eine effizientere Abfrageverarbeitung, wodurch die Antwortzeiten und Betriebskosten im Vergleich zu anderen Vektordatenbanken erheblich reduziert werden.

Grouping Search verbessert die Fähigkeit von Milvus, große Mengen komplexer Abfragen zu verwalten, und entspricht den Praktiken des High-Performance-Computing für robuste Datenverwaltungslösungen.

Beta-Unterstützung für Sparse-Vektor-Embeddings

Sparse Embeddings stellen einen Paradigmenwechsel gegenüber den traditionellen Dense-Vector-Ansätzen dar, da sie die Nuancen der semantischen Ähnlichkeit und nicht nur die Häufigkeit der Schlüsselwörter berücksichtigen. Diese Unterscheidung ermöglicht eine nuanciertere Suche, die sich eng an den semantischen Inhalt der Abfrage und der Dokumente anlehnt. Dünne Vektormodelle, die vor allem im Information Retrieval und in der Verarbeitung natürlicher Sprache nützlich sind, bieten im Vergleich zu ihren dichten Gegenstücken leistungsstarke Suchmöglichkeiten außerhalb des Bereichs und eine bessere Interpretierbarkeit.

In Milvus 2.4 haben wir die hybride Suche erweitert, um spärliche Einbettungen einzubeziehen, die von fortgeschrittenen neuronalen Modellen wie SPLADEv2 oder statistischen Modellen wie BM25 erzeugt werden. In Milvus werden spärliche Vektoren gleichberechtigt mit dichten Vektoren behandelt, was die Erstellung von Sammlungen mit spärlichen Vektorfeldern, das Einfügen von Daten, die Indexerstellung und die Durchführung von Ähnlichkeitssuchen ermöglicht. Insbesondere unterstützen spärliche Einbettungen in Milvus die Distanzmetrik Inneres Produkt (IP), was angesichts ihrer hochdimensionalen Natur von Vorteil ist, da andere Metriken weniger effektiv sind. Diese Funktionalität unterstützt auch Datentypen mit einer Dimension als vorzeichenlose 32-Bit-Ganzzahl und einer 32-Bit-Fließkommazahl für den Wert, was ein breites Spektrum von Anwendungen ermöglicht, von differenzierten Textsuchen bis hin zu ausgefeilten Information Retrieval Systemen.

Mit dieser neuen Funktion ermöglicht Milvus hybride Suchmethoden, die Schlüsselwort- und Einbettungstechniken miteinander verbinden, und bietet einen nahtlosen Übergang für Benutzer, die von Schlüsselwort-zentrierten Such-Frameworks zu einer umfassenden, wartungsarmen Lösung wechseln.

Wir bezeichnen diese Funktion als "Beta", um unsere Leistungstests der Funktion fortzusetzen und Feedback von der Community zu sammeln. Die allgemeine Verfügbarkeit (GA) der Sparse-Vector-Unterstützung wird mit der Veröffentlichung von Milvus 3.0 erwartet.

CAGRA-Index-Unterstützung für erweiterte GPU-beschleunigte Graph-Indizierung

Die von NVIDIA entwickelte CAGRA (Cuda Anns GRAph-based) ist eine GPU-basierte Graph-Indexierungstechnologie, die herkömmliche CPU-basierte Methoden wie den HNSW-Index an Effizienz und Leistung deutlich übertrifft, insbesondere in Umgebungen mit hohem Durchsatz.

Mit der Einführung des CAGRA-Index bietet Milvus 2.4 eine verbesserte GPU-beschleunigte Graph-Indizierung. Diese Verbesserung ist ideal für die Entwicklung von Ähnlichkeitssuchanwendungen, die eine minimale Latenzzeit erfordern. Darüber hinaus integriert Milvus 2.4 eine Brute-Force-Suche mit dem CAGRA-Index, um maximale Recall-Raten in Anwendungen zu erzielen. Detaillierte Einblicke finden Sie im Einführungsblog zu CAGRA.

Milvus Raft CAGRA vs. Milvus HNSW Milvus Raft CAGRA vs. Milvus HNSW

Zusätzliche Erweiterungen und Funktionen

Milvus 2.4 enthält auch andere wichtige Verbesserungen, wie z. B. die Unterstützung von regulären Ausdrücken für ein verbessertes Substring-Matching bei der Filterung von Metadaten, einen neuen skalaren invertierten Index für eine effiziente Filterung skalarer Datentypen und ein Change Data Capture-Tool zur Überwachung und Replikation von Änderungen in Milvus-Sammlungen. Diese Aktualisierungen verbessern zusammen die Leistung und Vielseitigkeit von Milvus und machen es zu einer umfassenden Lösung für komplexe Datenoperationen.

Weitere Einzelheiten finden Sie in der Milvus 2.4-Dokumentation.

Bleiben Sie in Verbindung!

Möchten Sie mehr über Milvus 2.4 erfahren? Nehmen Sie an unserem bevorstehenden Webinar mit James Luan, VP of Engineering bei Zilliz, teil und diskutieren Sie ausführlich über die Möglichkeiten dieser neuesten Version. Wenn Sie Fragen oder Feedback haben, treten Sie unserem Discord-Kanal bei, um sich mit unseren Ingenieuren und Community-Mitgliedern auszutauschen. Vergessen Sie nicht, uns auf Twitter oder LinkedIn zu folgen, um die neuesten Nachrichten und Updates über Milvus zu erhalten.

Like the article? Spread the word

Weiterlesen