🚀 Testen Sie Zilliz Cloud, die vollständig verwaltete Milvus, kostenlos – erleben Sie 10x schnellere Leistung! Jetzt testen>>

milvus-logo
LFAI
Home
  • Leitfaden für die Verwaltung

queryNode-bezogene Konfigurationen

Verwandte Konfigurationen von queryNode, die zur Durchführung einer hybriden Suche zwischen Vektor- und Skalardaten verwendet werden.

queryNode.stats.publishInterval

Beschreibung Standardwert
Das Intervall, in dem der Abfrageknoten die Knotenstatistikinformationen veröffentlicht, einschließlich Segmentstatus, CPU-Nutzung, Speichernutzung, Gesundheitsstatus usw. Einheit: ms. 1000

queryNode.segcore.knowhereThreadPoolNumRatio

Beschreibung Standardwert
Die Anzahl der Threads im Thread-Pool von knowhere. Wenn Disk aktiviert ist, wird die Poolgröße mit knowhereThreadPoolNumRatio([1, 32]) multipliziert. 4

queryNode.segcore.chunkRows

Beschreibung Standardwert
Zeilenzahl, durch die Segcore ein Segment in Chunks unterteilt. 128

queryNode.segcore.interimIndex.enableIndex

Beschreibung Standardwert
  • Ob ein temporärer Index für wachsende Segmente und versiegelte Segmente, die noch nicht indiziert sind, erstellt werden soll, um die Suchleistung zu verbessern.
  • Milvus wird schließlich alle Segmente versiegeln und indizieren, aber die Aktivierung dieser Option optimiert die Suchleistung für unmittelbare Abfragen nach dem Einfügen von Daten.
  • Der Standardwert ist true, was anzeigt, dass Milvus einen temporären Index für wachsende Segmente und versiegelte Segmente erstellt, die bei der Suche nicht indiziert werden.
  • true

    queryNode.segcore.interimIndex.nlist

    Beschreibung Standardwert
    temporärer Index nlist, es wird empfohlen, sqrt(chunkRows) zu setzen, muss kleiner als chunkRows/8 sein 128

    queryNode.segcore.interimIndex.nprobe

    Beschreibung Standardwert
    nprobe, um einen kleinen Index zu suchen, basierend auf Ihren Genauigkeitsanforderungen, muss kleiner als nlist sein 16

    queryNode.segcore.interimIndex.memExpansionRate

    Beschreibung Standardwert
    zusätzlicher Speicherbedarf für den Aufbau des Zwischenindex 1.15

    queryNode.segcore.interimIndex.buildParallelRate

    Beschreibung Standardwert
    das Verhältnis zwischen dem parallelen Aufbau des Zwischenindex und der CPU-Zahl 0.5

    queryNode.segcore.multipleChunkedEnable

    Beschreibung Standardwert
    Aktivieren der Mehrfach-Chunked-Suche true

    queryNode.segcore.knowhereScoreConsistency

    Beschreibung Standardwert
    Logik für die Berechnung der starken Konsistenzbewertung von Knowhere einschalten falsch

    queryNode.loadMemoryUsageFactor

    Beschreibung Standardwert
    Der Multiplikationsfaktor für die Berechnung des Speicherverbrauchs beim Laden von Segmenten 1

    queryNode.enableDisk

    Beschreibung Standardwert
    enable querynode load disk index, and search on disk index falsch

    queryNode.cache.memoryLimit

    Beschreibung Standardwert
    2 GB, 2 * 1024 *1024 *1024 2147483648

    queryNode.cache.readAheadPolicy

    Beschreibung Standardwert
    Die Vorauslese-Richtlinie des Chunk-Cache, Optionen: `normal, random, sequentiell, willneed, dontneed` willneed

    queryNode.cache.warmup

    Beschreibung Standardwert
  • Optionen: async, sync, disable.
  • Gibt die Notwendigkeit des Aufwärmens des Chunk-Cache an.
  • 1. Wenn auf "sync" oder "async" gesetzt, werden die ursprünglichen Vektordaten während des Ladevorgangs synchron/asynchron in den
  • Chunk-Cache während des Ladevorgangs geladen. Dieser Ansatz hat das Potenzial, die Abfrage-/Suchlatenz
  • für eine bestimmte Dauer nach dem Laden erheblich zu reduzieren, auch wenn dies mit einem gleichzeitigen Anstieg der Festplattennutzung einhergeht;
  • 2. Bei der Einstellung "disable" werden die ursprünglichen Vektordaten nur während der Suche/Abfrage in den Chunk-Cache geladen.
  • deaktivieren

    queryNode.mmap.vectorField

    Beschreibung Standardwert
    mmap zum Laden von Vektordaten einschalten falsch

    queryNode.mmap.vectorIndex

    Beschreibung Standardwert
    mmap für das Laden des Vektorindexes einschalten falsch

    queryNode.mmap.scalarField

    Beschreibung Standardwert
    mmap für das Laden skalarer Daten einschalten falsch

    queryNode.mmap.scalarIndex

    Beschreibung Standardwert
    mmap für das Laden von skalaren Indizes einschalten falsch

    queryNode.mmap.chunkCache

    Beschreibung Standardwert
    Aktiviert mmap für Chunk-Cache (Abrufen von Rohvektoren). true

    queryNode.mmap.growingMmapEnabled

    Beschreibung Standardwert
  • Aktiviert die Speicherzuordnung (mmap), um die Handhabung wachsender Rohdaten zu optimieren.
  • Durch die Aktivierung dieser Funktion wird der mit neu hinzugefügten oder geänderten Daten verbundene Speicher-Overhead erheblich minimiert.
  • Diese Optimierung kann jedoch auf Kosten einer leichten Verringerung der Abfragelatenz für die betroffenen Datensegmente gehen.
  • falsch

    queryNode.mmap.fixedFileSizeForMmapAlloc

    Beschreibung Standardwert
    Größe der tmp-Datei für mmap chunk manager 1

    queryNode.mmap.maxDiskUsagePercentageForMmapAlloc

    Beschreibung Standardwert
    Prozentualer Anteil der Festplatte, die im mmap chunk manager verwendet wird 50

    queryNode.lazyload.enabled

    Beschreibung Standardwert
    Lazyload zum Laden von Daten einschalten falsch

    queryNode.lazyload.waitTimeout

    Beschreibung Standardwert
    max wait timeout Dauer in Millisekunden vor Beginn der Lazyload-Suche und -Abfrage 30000

    queryNode.lazyload.requestResourceTimeout

    Beschreibung Standardwert
    max timeout in Millisekunden für das Warten auf die Ressource für lazy load, standardmäßig 5s 5000

    queryNode.lazyload.requestResourceRetryInterval

    Beschreibung Standardwert
    Wiederholungsintervall in Millisekunden für wartende Anforderungsressourcen für träges Laden, Standardwert 2s 2000

    queryNode.lazyload.maxRetryTimes

    Beschreibung Standardwert
    Maximale Wiederholungszeiten für träges Laden, standardmäßig 1 1

    queryNode.lazyload.maxEvictPerRetry

    Beschreibung Standardwert
    max evict count für lazy load, 1 als Voreinstellung 1

    queryNode.indexOffsetCacheEnabled

    Beschreibung Standardwert
    enable index offset cache for some scalar indexes, now is just for bitmap index, enable this param can improve performance for retrieving raw data from index false

    queryNode.scheduler.maxReadConcurrentRatio

    Beschreibung Standardwert
  • maxReadConcurrentRatio ist das Gleichzeitigkeitsverhältnis von Leseaufgaben (Suchaufgaben und Abfrageaufgaben).
  • Die maximale Lesegleichzeitigkeit entspricht dem Wert von hardware.GetCPUNum * maxReadConcurrentRatio.
  • Der Standardwert ist 2,0, d. h. die maximale Gleichzeitigkeit beim Lesen entspricht dem Wert von hardware.GetCPUNum * 2.
  • Die maximale Lesegleichzeitigkeit muss größer als oder gleich 1 und kleiner als oder gleich hardware.GetCPUNum * 100 sein.
  • (0, 100]
  • 1

    queryNode.scheduler.cpuRatio

    Beschreibung Standardwert
    Verhältnis, das zur Schätzung der CPU-Auslastung von Leseaufgaben verwendet wird. 10

    queryNode.scheduler.scheduleReadPolicy.name

    Beschreibung Standardwert
  • fifo: Eine FIFO-Warteschlange unterstützt den Zeitplan.
  • user-task-polling:
  • Die Aufgaben des Benutzers werden nacheinander abgefragt und eingeplant.
  • Die Zeitplanung ist fair auf die Granularität der Aufgaben abgestimmt.
  • Die Richtlinie basiert auf dem Benutzernamen zur Authentifizierung.
  • Und ein leerer Benutzername wird als derselbe Benutzer betrachtet.
  • Wenn es keine Mehrfachbenutzer gibt, verfällt die Richtlinie in FIFO"
  • fifo

    queryNode.scheduler.scheduleReadPolicy.taskQueueExpire

    Beschreibung Standardwert
    Legt fest, wie lange (viele Sekunden) die Warteschlange nach dem Leeren der Warteschlange verbleibt 60

    queryNode.scheduler.scheduleReadPolicy.enableCrossUserGrouping

    Beschreibung Standardwert
    Aktiviert die benutzerübergreifende Gruppierung bei der Verwendung der Richtlinie für die Abfrage von Benutzeraufgaben. (Deaktivieren Sie es, wenn die Aufgaben der Benutzer nicht zusammengeführt werden können) falsch

    queryNode.scheduler.scheduleReadPolicy.maxPendingTaskPerUser

    Beschreibung Standardwert
    Maximal ausstehende Aufgaben pro Benutzer im Planer 1024

    queryNode.levelZeroForwardPolicy

    Beschreibung Standardwert
    Delegatorebene Null-Löschung-Weiterleitungsrichtlinie, mögliche Option["FilterByBF", "RemoteLoad"] FilterByBF

    queryNode.streamingDeltaForwardPolicy

    Beschreibung Standardwert
    Delegator Streaming Deletion Forward Policy, mögliche Option["FilterByBF", "Direct"] FilterByBF

    queryNode.dataSync.flowGraph.maxQueueLength

    Beschreibung Standardwert
    Die maximale Größe des Aufgabenwarteschlangen-Cache im Flussdiagramm im Abfrageknoten. 16

    queryNode.dataSync.flowGraph.maxParallelism

    Beschreibung Standardwert
    Maximale Anzahl der parallel ausgeführten Aufgaben im Ablaufdiagramm 1024

    queryNode.enableSegmentPrune

    Beschreibung Standardwert
    Partitionsstatistiken verwenden, um Daten in der Suche/Abfrage auf dem Shard-Delegator zu beschneiden falsch

    queryNode.queryStreamBatchSize

    Beschreibung Standardwert
    minimale Stapelgröße der Stream-Abfrage zurückgeben 4194304

    queryNode.queryStreamMaxBatchSize

    Beschreibung Standardwert
    Rückgabe der maximalen Chargengröße der Stream-Abfrage 134217728

    queryNode.bloomFilterApplyParallelFactor

    Beschreibung Standardwert
    Parallelitätsfaktor bei Anwendung von pk auf Bloom-Filter, Voreinstellung 4*CPU_CORE_NUM 4

    queryNode.workerPooling.size

    Beschreibung Standardwert
    die Größe des Querynode-Client-Pools für Arbeiter 10

    queryNode.ip

    Beschreibung Standardwert
    TCP/IP-Adresse des QueryNode. Wenn nicht angegeben, wird die erste unicastbare Adresse verwendet.

    queryNode.port

    Beschreibung Standardwert
    TCP-Port von queryNode 21123

    queryNode.grpc.serverMaxSendSize

    Beschreibung Standardwert
    Die maximale Größe jeder RPC-Anfrage, die der queryNode senden kann, Einheit: Byte 536870912

    queryNode.grpc.serverMaxRecvSize

    Beschreibung Standardwert
    Die maximale Größe jeder RPC-Anfrage, die der queryNode empfangen kann, Einheit: Byte 268435456

    queryNode.grpc.clientMaxSendSize

    Beschreibung Standardwert
    Die maximale Größe jeder RPC-Anfrage, die die Clients auf queryNode senden können, Einheit: Byte 268435456

    queryNode.grpc.clientMaxRecvSize

    Beschreibung Standardwert
    Die maximale Größe jeder RPC-Anfrage, die die Clients auf queryNode empfangen können, Einheit: Byte 536870912
    Tabelle der Inhalte

    Try Managed Milvus for Free

    Zilliz Cloud is hassle-free, powered by Milvus and 10x faster.

    Get Started
    Feedback

    War diese Seite hilfreich?