milvus-logo
LFAI
Home
  • Leitfaden für die Verwaltung

queryNode-bezogene Konfigurationen

Verwandte Konfigurationen von queryNode, die zur Durchführung einer hybriden Suche zwischen Vektor- und Skalardaten verwendet werden.

queryNode.stats.publishInterval

Beschreibung Standardwert
Das Intervall, in dem der Abfrageknoten die Knotenstatistikinformationen veröffentlicht, einschließlich Segmentstatus, CPU-Nutzung, Speichernutzung, Gesundheitsstatus usw. Einheit: ms. 1000

queryNode.segcore.knowhereThreadPoolNumRatio

Beschreibung Standardwert
Die Anzahl der Threads im Thread-Pool von knowhere. Wenn Disk aktiviert ist, wird die Poolgröße mit knowhereThreadPoolNumRatio([1, 32]) multipliziert. 4

queryNode.segcore.chunkRows

Beschreibung Standardwert
Zeilenzahl, durch die Segcore ein Segment in Chunks unterteilt. 128

queryNode.segcore.interimIndex.enableIndex

Beschreibung Standardwert
  • Ob ein temporärer Index für wachsende Segmente und versiegelte Segmente, die noch nicht indiziert sind, erstellt werden soll, um die Suchleistung zu verbessern.
  • Milvus wird schließlich alle Segmente versiegeln und indizieren, aber die Aktivierung dieser Option optimiert die Suchleistung für unmittelbare Abfragen nach dem Einfügen von Daten.
  • Der Standardwert ist true, was anzeigt, dass Milvus einen temporären Index für wachsende Segmente und versiegelte Segmente erstellt, die bei der Suche nicht indiziert werden.
  • true

    queryNode.segcore.interimIndex.nlist

    Beschreibung Standardwert
    temporärer Index nlist, es wird empfohlen, sqrt(chunkRows) zu setzen, muss kleiner als chunkRows/8 sein 128

    queryNode.segcore.interimIndex.nprobe

    Beschreibung Standardwert
    nprobe, um einen kleinen Index zu suchen, basierend auf Ihren Genauigkeitsanforderungen, muss kleiner als nlist sein 16

    queryNode.segcore.interimIndex.memExpansionRate

    Beschreibung Standardwert
    zusätzlicher Speicherbedarf für den Aufbau eines Zwischenindex 1.15

    queryNode.segcore.interimIndex.buildParallelRate

    Beschreibung Standardwert
    das Verhältnis zwischen dem parallelen Aufbau des Zwischenindex und der CPU-Zahl 0.5

    queryNode.segcore.knowhereScoreConsistency

    Beschreibung Standardwert
    Aktivieren der Berechnungslogik für die starke Konsistenzbewertung von Knowhere falsch

    queryNode.loadMemoryUsageFactor

    Beschreibung Standardwert
    Der Multiplikationsfaktor für die Berechnung des Speicherverbrauchs beim Laden von Segmenten 1

    queryNode.enableDisk

    Beschreibung Standardwert
    enable querynode load disk index, and search on disk index falsch

    queryNode.cache.memoryLimit

    Beschreibung Standardwert
    2 GB, 2 * 1024 *1024 *1024 2147483648

    queryNode.cache.readAheadPolicy

    Beschreibung Standardwert
    Die Vorauslese-Richtlinie des Chunk-Cache, Optionen: `normal, random, sequentiell, willneed, dontneed` willneed

    queryNode.cache.warmup

    Beschreibung Standardwert
  • Optionen: async, sync, disable.
  • Gibt die Notwendigkeit des Aufwärmens des Chunk-Cache an.
  • 1. Wenn auf "sync" oder "async" gesetzt, werden die ursprünglichen Vektordaten während des Ladevorgangs synchron/asynchron in den
  • Chunk-Cache während des Ladevorgangs geladen. Dieser Ansatz hat das Potenzial, die Abfrage-/Suchlatenz
  • für eine bestimmte Dauer nach dem Laden erheblich zu reduzieren, auch wenn dies mit einem gleichzeitigen Anstieg der Festplattennutzung einhergeht;
  • 2. Bei der Einstellung "disable" werden die ursprünglichen Vektordaten nur während der Suche/Abfrage in den Chunk-Cache geladen.
  • deaktivieren

    queryNode.mmap.mmapEnabled

    Beschreibung Standardwert
    mmap zum Laden von Daten einschalten falsch

    queryNode.mmap.growingMmapEnabled

    Beschreibung Standardwert
    mmap für die Verwendung von wachsenden Rohdaten einschalten falsch

    queryNode.mmap.fixedFileSizeForMmapAlloc

    Beschreibung Standardwert
    Größe der tmp-Datei für mmap chunk manager 1

    queryNode.mmap.maxDiskUsagePercentageForMmapAlloc

    Beschreibung Standardwert
    Prozentualer Anteil der Festplatte, die im mmap chunk manager verwendet wird 50

    queryNode.lazyload.enabled

    Beschreibung Standardwert
    Lazyload zum Laden von Daten einschalten falsch

    queryNode.lazyload.waitTimeout

    Beschreibung Standardwert
    max wait timeout Dauer in Millisekunden vor Beginn der Lazyload-Suche und -Abfrage 30000

    queryNode.lazyload.requestResourceTimeout

    Beschreibung Standardwert
    max timeout in Millisekunden für das Warten auf die Ressource für lazy load, standardmäßig 5s 5000

    queryNode.lazyload.requestResourceRetryInterval

    Beschreibung Standardwert
    Wiederholungsintervall in Millisekunden für wartende Anforderungsressourcen für träges Laden, Standardwert 2s 2000

    queryNode.lazyload.maxRetryTimes

    Beschreibung Standardwert
    Maximale Wiederholungszeiten für träges Laden, standardmäßig 1 1

    queryNode.lazyload.maxEvictPerRetry

    Beschreibung Standardwert
    max evict count für lazy load, 1 als Voreinstellung 1

    queryNode.scheduler.maxReadConcurrentRatio

    Beschreibung Standardwert
  • maxReadConcurrentRatio ist das Gleichzeitigkeitsverhältnis von Leseaufgaben (Suchaufgaben und Abfrageaufgaben).
  • Die maximale Gleichzeitigkeit beim Lesen entspricht dem Wert von hardware.GetCPUNum * maxReadConcurrentRatio.
  • Der Standardwert ist 2,0, d. h. die maximale Gleichzeitigkeit beim Lesen entspricht dem Wert von hardware.GetCPUNum * 2.
  • Die maximale Lesegleichzeitigkeit muss größer als oder gleich 1 und kleiner als oder gleich hardware.GetCPUNum * 100 sein.
  • (0, 100]
  • 1

    queryNode.scheduler.cpuRatio

    Beschreibung Standardwert
    Verhältnis, das zur Schätzung der CPU-Auslastung von Leseaufgaben verwendet wird. 10

    queryNode.scheduler.scheduleReadPolicy.name

    Beschreibung Standardwert
  • fifo: Eine FIFO-Warteschlange unterstützt den Zeitplan.
  • user-task-polling:
  • Die Aufgaben des Benutzers werden nacheinander abgefragt und eingeplant.
  • Die Zeitplanung ist fair auf die Granularität der Aufgaben abgestimmt.
  • Die Richtlinie basiert auf dem Benutzernamen zur Authentifizierung.
  • Und ein leerer Benutzername wird als derselbe Benutzer betrachtet.
  • Wenn es keine Mehrfachbenutzer gibt, verfällt die Richtlinie in FIFO"
  • fifo

    queryNode.scheduler.scheduleReadPolicy.taskQueueExpire

    Beschreibung Standardwert
    Legt fest, wie lange (viele Sekunden) die Warteschlange nach dem Leeren der Warteschlange verbleibt 60

    queryNode.scheduler.scheduleReadPolicy.enableCrossUserGrouping

    Beschreibung Standardwert
    Aktiviert die benutzerübergreifende Gruppierung bei der Verwendung der Richtlinie für die Abfrage von Benutzeraufgaben. (Deaktivieren Sie es, wenn die Aufgaben der Benutzer nicht zusammengeführt werden können) falsch

    queryNode.scheduler.scheduleReadPolicy.maxPendingTaskPerUser

    Beschreibung Standardwert
    Maximal ausstehende Aufgaben pro Benutzer im Planer 1024

    queryNode.dataSync.flowGraph.maxQueueLength

    Beschreibung Standardwert
    Die maximale Größe des Aufgaben-Warteschlangen-Caches im Ablaufdiagramm im Abfrageknoten. 16

    queryNode.dataSync.flowGraph.maxParallelism

    Beschreibung Standardwert
    Maximale Anzahl der parallel ausgeführten Aufgaben im Ablaufdiagramm 1024

    queryNode.enableSegmentPrune

    Beschreibung Standardwert
    Partitionsstatistiken verwenden, um Daten in der Suche/Abfrage auf dem Shard-Delegator zu beschneiden falsch

    queryNode.bloomFilterApplyParallelFactor

    Beschreibung Standardwert
    Paralleler Faktor für die Anwendung von pk auf Bloom-Filter, Voreinstellung 4*CPU_CORE_NUM 4

    queryNode.queryStreamBatchSize

    Beschreibung Standardwert
    Rückgabestapelgröße der Stream-Abfrage 4194304

    queryNode.workerPooling.size

    Beschreibung Standardwert
    die Größe für den Querynode-Client-Pool der Arbeiter 10

    queryNode.ip

    Beschreibung Standardwert
    TCP/IP-Adresse des QueryNode. Wenn nicht angegeben, wird die erste unicastbare Adresse verwendet.

    queryNode.port

    Beschreibung Standardwert
    TCP-Port von queryNode 21123

    queryNode.grpc.serverMaxSendSize

    Beschreibung Standardwert
    Die maximale Größe jeder RPC-Anfrage, die der queryNode senden kann, Einheit: Byte 536870912

    queryNode.grpc.serverMaxRecvSize

    Beschreibung Standardwert
    Die maximale Größe jeder RPC-Anfrage, die der queryNode empfangen kann, Einheit: Byte 268435456

    queryNode.grpc.clientMaxSendSize

    Beschreibung Standardwert
    Die maximale Größe jeder RPC-Anfrage, die die Clients auf queryNode senden können, Einheit: Byte 268435456

    queryNode.grpc.clientMaxRecvSize

    Beschreibung Standardwert
    Die maximale Größe jeder RPC-Anfrage, die die Clients auf queryNode empfangen können, Einheit: Byte 536870912

    Übersetzt vonDeepLogo

    Tabelle der Inhalte
    Feedback

    War diese Seite hilfreich?