milvus-logo
LFAI
Casa
  • Guida all'amministrazione

Configurazioni correlate a queryNode

Configurazione correlata di queryNode, usata per eseguire una ricerca ibrida tra dati vettoriali e scalari.

queryNode.stats.publishInterval

Descrizione Valore predefinito
L'intervallo in cui il nodo di query pubblica le informazioni sulle statistiche del nodo, tra cui lo stato del segmento, l'uso della cpu, l'uso della memoria, lo stato di salute, ecc. Unità: ms. 1000

queryNode.segcore.knowhereThreadPoolNumRatio

Descrizione Valore predefinito
Il numero di thread nel pool di thread di knowhere. Se il disco è abilitato, la dimensione del pool si moltiplica con knowhereThreadPoolNumRatio([1, 32]). 4

queryNode.segcore.chunkRows

Descrizione Valore predefinito
Numero di righe con cui Segcore divide un segmento in pezzi. 128

queryNode.segcore.interimIndex.enableIndex

Descrizione Valore predefinito
  • Se creare un indice temporaneo per i segmenti in crescita e per i segmenti sigillati non ancora indicizzati, migliorando le prestazioni di ricerca.
  • Milvus finirà per sigillare e indicizzare tutti i segmenti, ma l'attivazione di questa opzione ottimizza le prestazioni di ricerca per le query immediate dopo l'inserimento dei dati.
  • L'impostazione predefinita è true, a indicare che Milvus crea un indice temporaneo per i segmenti in crescita e per i segmenti sigillati che non vengono indicizzati al momento della ricerca.
  • vero

    queryNode.segcore.interimIndex.nlist

    Descrizione Valore predefinito
    indice temporaneo nlist, si consiglia di impostare sqrt(chunkRows), deve essere inferiore a chunkRows/8 128

    queryNode.segcore.interimIndex.nprobe

    Descrizione Valore predefinito
    nprobe per cercare un indice piccolo, in base ai requisiti di precisione, deve essere inferiore a nlist 16

    queryNode.segcore.interimIndex.memExpansionRate

    Descrizione Valore predefinito
    memoria extra necessaria per la costruzione dell'indice intermedio 1.15

    queryNode.segcore.interimIndex.buildParallelRate

    Descrizione Valore predefinito
    rapporto tra la costruzione dell'indice intermedio in parallelo e il numero di cpu 0.5

    queryNode.segcore.knowhereScoreConsistency

    Descrizione Valore predefinito
    Abilita la logica di calcolo del punteggio di consistenza forte di knowhere falso

    queryNode.loadMemoryUsageFactor

    Descrizione Valore predefinito
    Il fattore di moltiplicazione del calcolo dell'utilizzo della memoria durante il caricamento dei segmenti 1

    queryNode.enableDisk

    Descrizione Valore predefinito
    abilita il caricamento dell'indice del disco da parte del querynode e la ricerca sull'indice del disco falso

    queryNode.cache.memoryLimit

    Descrizione Valore predefinito
    2 GB, 2 * 1024 *1024 *1024 2147483648

    queryNode.cache.readAheadPolicy

    Descrizione Valore predefinito
    La politica di lettura anticipata della chunk cache, opzioni: `normale, casuale, sequenziale, willneed, dontneed`. willneed

    queryNode.cache.warmup

    Descrizione Valore predefinito
  • opzioni: async, sync, disable.
  • Specifica la necessità di riscaldare la cache dei chunk.
  • 1. Se si imposta "sync" o "async", i dati vettoriali originali vengono caricati in modo sincrono/asincrono nella chunk cache durante il processo di caricamento.
  • cache dei chunk durante il processo di caricamento. Questo approccio ha il potenziale di ridurre sostanzialmente la latenza delle query e delle ricerche per una durata specifica dopo il caricamento.
  • per una durata specifica dopo il caricamento, anche se accompagnato da un contemporaneo aumento dell'utilizzo del disco;
  • 2. Se impostato su "disable", i dati vettoriali originali saranno caricati nella cache dei chunk solo durante la ricerca/query.
  • disabilitare

    queryNode.mmap.mmapEnabled

    Descrizione Valore predefinito
    Abilita mmap per il caricamento dei dati falso

    queryNode.mmap.growingMmapEnabled

    Descrizione Valore predefinito
    Abilita mmap per l'utilizzo di dati grezzi in crescita falso

    queryNode.mmap.fixedFileSizeForMmapAlloc

    Descrizione Valore predefinito
    Dimensione del file tmp per il gestore dei chunk di mmap 1

    queryNode.mmap.maxDiskUsagePercentageForMmapAlloc

    Descrizione Valore predefinito
    percentuale di disco utilizzata in mmap chunk manager 50

    queryNode.lazyload.enabled

    Descrizione Valore predefinito
    Abilita il lazyload per il caricamento dei dati falso

    queryNode.lazyload.waitTimeout

    Descrizione Valore predefinito
    timeout massimo di attesa durata in millisecondi prima di iniziare la ricerca e il recupero con lazyload 30000

    queryNode.lazyload.requestResourceTimeout

    Descrizione Valore predefinito
    timeout massimo in millisecondi per l'attesa della risorsa richiesta per il carico pigro, 5s per impostazione predefinita 5000

    queryNode.lazyload.requestResourceRetryInterval

    Descrizione Valore predefinito
    intervallo di riprova in millisecondi per la richiesta di risorsa in attesa per carico pigro, 2s per impostazione predefinita 2000

    queryNode.lazyload.maxRetryTimes

    Descrizione Valore predefinito
    tempi massimi di riprova per il carico pigro, 1 per impostazione predefinita 1

    queryNode.lazyload.maxEvictPerRetry

    Descrizione Valore predefinito
    Numero massimo di sfratti per il carico pigro, 1 per impostazione predefinita 1

    queryNode.scheduler.maxReadConcurrentRatio

    Descrizione Valore predefinito
  • maxReadConcurrentRatio è il rapporto di concorrenza dei task di lettura (task di ricerca e task di query).
  • La concurrency massima di lettura è il valore di hardware.GetCPUNum * maxReadConcurrentRatio.
  • L'impostazione predefinita è 2,0, il che significa che la concomitanza massima di lettura sarà il valore di hardware.GetCPUNum * 2.
  • La velocità di lettura massima deve essere maggiore o uguale a 1 e minore o uguale a hardware.GetCPUNum * 100.
  • (0, 100]
  • 1

    queryNode.scheduler.cpuRatio

    Descrizione Valore predefinito
    rapporto utilizzato per stimare l'utilizzo della cpu dei task di lettura. 10

    queryNode.scheduler.scheduleReadPolicy.name

    Descrizione Valore predefinito
  • fifo: Una coda FIFO che supporta la pianificazione.
  • user-task-polling:
  • I task dell'utente vengono interrogati uno per uno e programmati.
  • La pianificazione è equa in base alla granularità dei task.
  • La politica si basa sul nome utente per l'autenticazione.
  • Un nome utente vuoto viene considerato come lo stesso utente.
  • Quando non ci sono più utenti, la politica decade in FIFO".
  • fifo

    queryNode.scheduler.scheduleReadPolicy.taskQueueExpire

    Descrizione Valore predefinito
    Controlla il tempo (molti secondi) in cui la coda viene mantenuta da quando è vuota. 60

    queryNode.scheduler.scheduleReadPolicy.enableCrossUserGrouping

    Descrizione Valore predefinito
    Abilita il raggruppamento trasversale degli utenti quando si usa il criterio di polling dei compiti dell'utente. (Disabilitarlo se le attività dell'utente non possono unirsi l'una all'altra) falso

    queryNode.scheduler.scheduleReadPolicy.maxPendingTaskPerUser

    Descrizione Valore predefinito
    Attività massima in attesa per utente nello scheduler 1024

    queryNode.dataSync.flowGraph.maxQueueLength

    Descrizione Valore predefinito
    Dimensione massima della cache della coda delle attività nel grafico di flusso nel nodo di interrogazione. 16

    queryNode.dataSync.flowGraph.maxParallelism

    Descrizione Valore predefinito
    Numero massimo di task eseguiti in parallelo nel diagramma di flusso 1024

    queryNode.enableSegmentPrune

    Descrizione Valore predefinito
    usa le statistiche di partizione per sfrondare i dati nella ricerca/query sul delegatore di shard falso

    queryNode.bloomFilterApplyParallelFactor

    Descrizione Valore predefinito
    fattore parallelo quando applicare il pk al filtro bloom, predefinito a 4*CPU_CORE_NUM 4

    queryNode.queryStreamBatchSize

    Descrizione Valore predefinito
    dimensione del batch di ritorno della query di flusso 4194304

    queryNode.workerPooling.size

    Descrizione Valore predefinito
    la dimensione del pool di client del querynode worker 10

    queryNode.ip

    Descrizione Valore predefinito
    Indirizzo TCP/IP del queryNode. Se non viene specificato, viene utilizzato il primo indirizzo non ciclabile.

    queryNode.port

    Descrizione Valore predefinito
    Porta TCP del queryNode 21123

    queryNode.grpc.serverMaxSendSize

    Descrizione Valore predefinito
    Dimensione massima di ogni richiesta RPC che il queryNode può inviare, unità: byte 536870912

    queryNode.grpc.serverMaxRecvSize

    Descrizione Valore predefinito
    La dimensione massima di ogni richiesta RPC che il queryNode può ricevere, unità: byte 268435456

    queryNode.grpc.clientMaxSendSize

    Descrizione Valore predefinito
    La dimensione massima di ogni richiesta RPC che i client del queryNode possono inviare, unità: byte 268435456

    queryNode.grpc.clientMaxRecvSize

    Descrizione Valore predefinito
    La dimensione massima di ogni richiesta RPC che i client sul queryNode possono ricevere, unità: byte 536870912

    Tradotto daDeepL

    Tabella dei contenuti

    Try Managed Milvus for Free

    Zilliz Cloud is hassle-free, powered by Milvus and 10x faster.

    Get Started
    Feedback

    Questa pagina è stata utile?