🚀 Testen Sie Zilliz Cloud, die vollständig verwaltete Milvus, kostenlos – erleben Sie 10x schnellere Leistung! Jetzt testen>>

milvus-logo
LFAI
  • Home
  • Blog
  • Optimierung der Datenkommunikation: Milvus setzt auf NATS Messaging

Optimierung der Datenkommunikation: Milvus setzt auf NATS Messaging

  • Engineering
November 24, 2023
Zhen Ye

Im komplizierten Geflecht der Datenverarbeitung ist die nahtlose Kommunikation der Faden, der die Abläufe zusammenhält. Milvus, die bahnbrechende Open-Source-Vektordatenbank, hat sich mit ihrer neuesten Funktion auf eine transformative Reise begeben: NATS-Messaging-Integration. In diesem umfassenden Blog-Beitrag werden wir die Feinheiten dieser Integration enträtseln und ihre Kernfunktionen, den Einrichtungsprozess, die Migrationsvorteile und den Vergleich mit ihrem Vorgänger RocksMQ untersuchen.

Die Rolle von Message Queues in Milvus verstehen

In der Cloud-nativen Architektur von Milvus ist die Nachrichtenwarteschlange oder der Log Broker von zentraler Bedeutung. Sie ist das Rückgrat, das persistente Datenströme, Synchronisierung, Ereignisbenachrichtigungen und Datenintegrität bei Systemwiederherstellungen gewährleistet. Traditionell war RocksMQ die einfachste Wahl im Milvus-Standalone-Modus, insbesondere im Vergleich zu Pulsar und Kafka, aber seine Grenzen wurden bei umfangreichen Daten und komplexen Szenarien deutlich.

Mit Milvus 2.3 wird NATS eingeführt, eine Single-Node-MQ-Implementierung, die die Verwaltung von Datenströmen neu definiert. Im Gegensatz zu seinen Vorgängern befreit NATS die Milvus-Benutzer von Leistungseinschränkungen und bietet eine nahtlose Erfahrung bei der Verarbeitung großer Datenmengen.

Was ist NATS?

NATS ist eine verteilte Systemverbindungstechnologie, die in Go implementiert ist. Sie unterstützt verschiedene Kommunikationsmodi wie Request-Reply und Publish-Subscribe zwischen Systemen, bietet Datenpersistenz durch JetStream und verteilte Fähigkeiten durch eingebautes RAFT. Auf der offiziellen NATS-Website finden Sie weitere Informationen zu NATS.

Im Milvus 2.3 Standalone-Modus bieten NATS, JetStream und PubSub Milvus robuste MQ-Funktionen.

Aktivieren von NATS

Milvus 2.3 bietet eine neue Steuerungsoption, mq.type, die es den Benutzern ermöglicht, die Art von MQ, die sie verwenden möchten, anzugeben. Um NATS zu aktivieren, setzen Sie mq.type=natsmq. Wenn Sie nach dem Starten von Milvus-Instanzen ähnliche Protokolle wie die unten stehenden sehen, haben Sie NATS als Nachrichtenwarteschlange erfolgreich aktiviert.

[INFO] [dependency/factory.go:83] ["try to init mq"] [standalone=true] [mqType=natsmq]

NATS für Milvus konfigurieren

Zu den NATS-Anpassungsoptionen gehören die Angabe des Listening Ports, des JetStream-Speicherverzeichnisses, der maximalen Nutzdatengröße und des Initialisierungs-Timeouts. Die Feinabstimmung dieser Einstellungen gewährleistet optimale Leistung und Zuverlässigkeit.

natsmq:
server: # server side configuration for natsmq.
port: 4222 # 4222 by default, Port for nats server listening.
storeDir: /var/lib/milvus/nats # /var/lib/milvus/nats by default, directory to use for JetStream storage of nats.
maxFileStore: 17179869184 # (B) 16GB by default, Maximum size of the 'file' storage.
maxPayload: 8388608 # (B) 8MB by default, Maximum number of bytes in a message payload.
maxPending: 67108864 # (B) 64MB by default, Maximum number of bytes buffered for a connection Applies to client connections.
initializeTimeout: 4000 # (ms) 4s by default, waiting for initialization of natsmq finished.
monitor:
trace: false # false by default, If true enable protocol trace log messages.
debug: false # false by default, If true enable debug log messages.
logTime: true # true by default, If set to false, log without timestamps.
logFile: /tmp/milvus/logs/nats.log # /tmp/milvus/logs/nats.log by default, Log file path relative to .. of milvus binary if use relative path.
logSizeLimit: 536870912 # (B) 512MB by default, Size in bytes after the log file rolls over to a new one.
retention:
maxAge: 4320 # (min) 3 days by default, Maximum age of any message in the P-channel.
maxBytes: # (B) None by default, How many bytes the single P-channel may contain. Removing oldest messages if the P-channel exceeds this size.
maxMsgs: # None by default, How many message the single P-channel may contain. Removing oldest messages if the P-channel exceeds this limit.

Anmerkung:

  • Sie müssen server.port für das Abhören des NATS-Servers angeben. Wenn es einen Portkonflikt gibt, kann Milvus nicht starten. Stellen Sie server.port=-1 so ein, dass ein Port zufällig ausgewählt wird.

  • storeDir gibt das Verzeichnis für die JetStream-Speicherung an. Wir empfehlen, das Verzeichnis auf einem leistungsstarken Solid-State-Laufwerk (SSD) zu speichern, um den Lese-/Schreibdurchsatz von Milvus zu verbessern.

  • maxFileStore legt die Obergrenze für die JetStream-Speichergröße fest. Das Überschreiten dieser Grenze verhindert das weitere Schreiben von Daten.

  • maxPayload begrenzt die Größe der einzelnen Nachrichten. Sie sollte über 5 MB liegen, um Schreibabweisungen zu vermeiden.

  • initializeTimeoutsteuert die Zeitüberschreitung beim Start des NATS-Servers.

  • monitor konfiguriert die unabhängigen Logs von NATS.

  • retention steuert den Aufbewahrungsmechanismus von NATS-Nachrichten.

Weitere Informationen finden Sie in der offiziellen NATS-Dokumentation.

Umstellung von RocksMQ auf NATS

Die Migration von RocksMQ zu NATS ist ein nahtloser Prozess, der Schritte wie das Stoppen von Schreibvorgängen, das Flushen von Daten, das Ändern von Konfigurationen und das Überprüfen der Migration durch Milvus-Protokolle umfasst.

  1. Bevor Sie die Migration einleiten, stoppen Sie alle Schreibvorgänge in Milvus.

  2. Führen Sie den Vorgang FlushALL in Milvus aus und warten Sie auf seinen Abschluss. Dieser Schritt stellt sicher, dass alle ausstehenden Daten geleert werden und das System zum Herunterfahren bereit ist.

  3. Ändern Sie die Milvus-Konfigurationsdatei, indem Sie mq.type=natsmq einstellen und die relevanten Optionen im Abschnitt natsmq anpassen.

  4. Starten Sie den Milvus 2.3.

  5. Sichern und bereinigen Sie die Originaldaten, die im Verzeichnis rocksmq.path gespeichert sind. (Optional)

NATS vs. RocksMQ: Ein Leistungsvergleich

Pub/Sub-Leistungstest

  • Testplattform: M1 Pro Chip / Speicher: 16GB

  • Test-Szenario: Wiederholtes Abonnieren und Veröffentlichen von Zufallsdatenpaketen an ein Topic, bis das letzte veröffentlichte Ergebnis empfangen wird.

  • Ergebnisse:

    • Bei kleineren Datenpaketen (< 64kb) übertrifft RocksMQ NATS in Bezug auf Speicher, CPU und Reaktionsgeschwindigkeit.

    • Bei größeren Datenpaketen (> 64kb) übertrifft NATS RocksMQ und bietet wesentlich schnellere Antwortzeiten.

Test TypMQAnzahl der OperationenKosten pro OperationKosten für SpeicherCPU-GesamtzeitSpeicherkosten
5MB*100 Pub/SubNATS501.650328186 s/op4,29 GB85.5825G
5MB*100 Pub/SubRocksMQ502.475595131 s/op1,18 GB81.4219G
1MB*500 Pub/SubNATS502.248722593 s/op2,60 GB96.5025G
1MB*500 Pub/SubRocksMQ502.554614279 s/op614,9 MB80.1919G
64KB*10000 Pub/SubNATS502.133345262 s/op3,29 GB97.5931G
64KB*10000 Pub/SubRocksMQ503.253778195 s/op331,2 MB134.624G
1KB*50000 Pub/SubNATS502.629391004 s/op635,1 MB179.672.6G
1KB*50000 Pub/SubRocksMQ500.897638581 s/op232,3 MB60.42521M

Tabelle 1: Ergebnisse der Pub/Sub-Leistungstests

Milvus-Integrationstest

Datengröße: 100M

Ergebnis: In umfangreichen Tests mit einem Datensatz von 100 Millionen Vektoren zeigte NATS eine geringere Vektorsuche und Abfragelatenz.

MetrikenRocksMQ (ms)NATS (ms)
Durchschnittliche Vektorsuch-Latenzzeit23.5520.17
Vektorsuchanfragen pro Sekunde (RPS)2.953.07
Durchschnittliche Abfrage-Latenzzeit7.26.74
Abfrageanfragen pro Sekunde (RPS)1.471.54

Tabelle 2: Ergebnisse der Milvus-Integrationstests mit einem 100-Meter-Datensatz

Datensatz: <100M

Ergebnis: Für Datensätze kleiner als 100M zeigen NATS und RocksMQ eine ähnliche Leistung.

Schlussfolgerung: Verstärkung von Milvus mit NATS Messaging

Die Integration von NATS in Milvus stellt einen bedeutenden Schritt in der Datenverarbeitung dar. Egal, ob Sie sich mit Echtzeitanalysen, Anwendungen für maschinelles Lernen oder anderen datenintensiven Projekten befassen, NATS unterstützt Ihre Projekte mit Effizienz, Zuverlässigkeit und Geschwindigkeit. Da sich die Datenlandschaft weiterentwickelt, gewährleistet ein robustes Messaging-System wie NATS innerhalb von Milvus eine nahtlose, zuverlässige und hochleistungsfähige Datenkommunikation.

Like the article? Spread the word

Weiterlesen