Verwandte Konfigurationen von queryNode, die zur Durchführung einer hybriden Suche zwischen Vektor- und Skalardaten verwendet werden.
Beschreibung |
Standardwert |
Das Intervall, in dem der Abfrageknoten die Knotenstatistikinformationen veröffentlicht, einschließlich Segmentstatus, CPU-Nutzung, Speichernutzung, Gesundheitsstatus usw. Einheit: ms. |
1000 |
Beschreibung |
Standardwert |
Die Anzahl der Threads im Thread-Pool von knowhere. Wenn Disk aktiviert ist, wird die Poolgröße mit knowhereThreadPoolNumRatio([1, 32]) multipliziert. |
4 |
Beschreibung |
Standardwert |
Zeilenzahl, durch die Segcore ein Segment in Chunks unterteilt. |
128 |
Beschreibung |
Standardwert |
Ob ein temporärer Index für wachsende Segmente und versiegelte Segmente, die noch nicht indiziert sind, erstellt werden soll, um die Suchleistung zu verbessern.
Milvus wird schließlich alle Segmente versiegeln und indizieren, aber die Aktivierung dieser Option optimiert die Suchleistung für unmittelbare Abfragen nach dem Einfügen von Daten.
Der Standardwert ist true, was anzeigt, dass Milvus einen temporären Index für wachsende Segmente und versiegelte Segmente erstellt, die bei der Suche nicht indiziert werden. |
true |
Beschreibung |
Standardwert |
temporärer Index nlist, es wird empfohlen, sqrt(chunkRows) zu setzen, muss kleiner als chunkRows/8 sein |
128 |
Beschreibung |
Standardwert |
nprobe, um einen kleinen Index zu suchen, basierend auf Ihren Genauigkeitsanforderungen, muss kleiner als nlist sein |
16 |
Beschreibung |
Standardwert |
zusätzlicher Speicherbedarf für den Aufbau des Zwischenindex |
1.15 |
Beschreibung |
Standardwert |
das Verhältnis zwischen dem parallelen Aufbau des Zwischenindex und der CPU-Zahl |
0.5 |
Beschreibung |
Standardwert |
Aktivieren der Berechnungslogik für die starke Konsistenzbewertung von Knowhere |
falsch |
Beschreibung |
Standardwert |
Der Multiplikationsfaktor für die Berechnung des Speicherverbrauchs beim Laden von Segmenten |
1 |
Beschreibung |
Standardwert |
enable querynode load disk index, and search on disk index |
falsch |
Beschreibung |
Standardwert |
2 GB, 2 * 1024 *1024 *1024 |
2147483648 |
Beschreibung |
Standardwert |
Die Vorauslese-Richtlinie des Chunk-Cache, Optionen: `normal, random, sequentiell, willneed, dontneed` |
willneed |
Beschreibung |
Standardwert |
Optionen: async, sync, disable.
Gibt die Notwendigkeit des Aufwärmens des Chunk-Cache an.
1. Wenn auf "sync" oder "async" gesetzt, werden die ursprünglichen Vektordaten während des Ladevorgangs synchron/asynchron in den
Chunk-Cache während des Ladevorgangs geladen. Dieser Ansatz hat das Potenzial, die Abfrage-/Suchlatenz
für eine bestimmte Dauer nach dem Laden erheblich zu reduzieren, auch wenn dies mit einem gleichzeitigen Anstieg der Festplattennutzung einhergeht;
2. Bei der Einstellung "disable" werden die ursprünglichen Vektordaten nur während der Suche/Abfrage in den Chunk-Cache geladen. |
deaktivieren |
Beschreibung |
Standardwert |
mmap zum Laden von Daten einschalten |
falsch |
Beschreibung |
Standardwert |
mmap für die Verwendung von wachsenden Rohdaten einschalten |
falsch |
Beschreibung |
Standardwert |
Lazyload zum Laden von Daten einschalten |
falsch |
Beschreibung |
Standardwert |
max wait timeout Dauer in Millisekunden vor Beginn der Lazyload-Suche und -Abfrage |
30000 |
Beschreibung |
Standardwert |
max timeout in Millisekunden für das Warten auf die Ressource für lazy load, standardmäßig 5s |
5000 |
Beschreibung |
Standardwert |
Wiederholungsintervall in Millisekunden für wartende Anforderungsressourcen für träges Laden, Standardwert 2s |
2000 |
Beschreibung |
Standardwert |
Maximale Wiederholungszeiten für träges Laden, standardmäßig 1 |
1 |
Beschreibung |
Standardwert |
max evict count for lazy load, 1 als Voreinstellung |
1 |
Beschreibung |
Standardwert |
maxReadConcurrentRatio ist das Gleichzeitigkeitsverhältnis von Leseaufgaben (Suchaufgaben und Abfrageaufgaben).
Die maximale Gleichzeitigkeit beim Lesen entspricht dem Wert von hardware.GetCPUNum * maxReadConcurrentRatio.
Der Standardwert ist 2,0, d. h. die maximale Gleichzeitigkeit beim Lesen entspricht dem Wert von hardware.GetCPUNum * 2.
Die maximale Lesegleichzeitigkeit muss größer als oder gleich 1 und kleiner als oder gleich hardware.GetCPUNum * 100 sein.
(0, 100] |
1 |
Beschreibung |
Standardwert |
Verhältnis, das zur Schätzung der CPU-Auslastung von Leseaufgaben verwendet wird. |
10 |
Beschreibung |
Standardwert |
fifo: Eine FIFO-Warteschlange unterstützt den Zeitplan.
user-task-polling:
Die Aufgaben des Benutzers werden nacheinander abgefragt und eingeplant.
Die Zeitplanung ist fair auf die Granularität der Aufgaben abgestimmt.
Die Richtlinie basiert auf dem Benutzernamen zur Authentifizierung.
Und ein leerer Benutzername wird als derselbe Benutzer betrachtet.
Wenn es keine Mehrfachbenutzer gibt, verfällt die Richtlinie in FIFO" |
fifo |
Beschreibung |
Standardwert |
Legt fest, wie lange (viele Sekunden) die Warteschlange nach dem Leeren der Warteschlange verbleibt |
60 |
Beschreibung |
Standardwert |
Aktiviert die benutzerübergreifende Gruppierung bei der Verwendung der Richtlinie für die Abfrage von Benutzeraufgaben. (Deaktivieren Sie es, wenn die Aufgaben der Benutzer nicht zusammengeführt werden können) |
falsch |
Beschreibung |
Standardwert |
Maximal ausstehende Aufgaben pro Benutzer im Planer |
1024 |
Beschreibung |
Standardwert |
Die maximale Größe des Aufgaben-Warteschlangen-Caches im Ablaufdiagramm im Abfrageknoten. |
16 |
Beschreibung |
Standardwert |
Maximale Anzahl der parallel ausgeführten Aufgaben im Ablaufdiagramm |
1024 |
Beschreibung |
Standardwert |
Partitionsstatistiken verwenden, um Daten in der Suche/Abfrage auf dem Shard-Delegator zu beschneiden |
falsch |
Beschreibung |
Standardwert |
Paralleler Faktor für die Anwendung von pk auf Bloom-Filter, Voreinstellung 4*CPU_CORE_NUM |
4 |
Beschreibung |
Standardwert |
Rückgabestapelgröße der Stream-Abfrage |
4194304 |
Beschreibung |
Standardwert |
die Größe für den Querynode-Client-Pool der Arbeiter |
10 |
Beschreibung |
Standardwert |
TCP/IP-Adresse des QueryNode. Wenn nicht angegeben, wird die erste unicastbare Adresse verwendet. |
|
Beschreibung |
Standardwert |
TCP-Port von queryNode |
21123 |
Beschreibung |
Standardwert |
Die maximale Größe jeder RPC-Anfrage, die der queryNode senden kann, Einheit: Byte |
536870912 |
Beschreibung |
Standardwert |
Die maximale Größe jeder RPC-Anfrage, die der queryNode empfangen kann, Einheit: Byte |
268435456 |
Beschreibung |
Standardwert |
Die maximale Größe jeder RPC-Anfrage, die die Clients auf queryNode senden können, Einheit: Byte |
268435456 |
Beschreibung |
Standardwert |
Die maximale Größe jeder RPC-Anfrage, die die Clients auf queryNode empfangen können, Einheit: Byte |
536870912 |