🚀 Prova Zilliz Cloud, la versione completamente gestita di Milvus, gratuitamente—sperimenta prestazioni 10 volte più veloci! Prova Ora>>

milvus-logo
LFAI
Casa
  • Guida all'amministrazione

Configurazioni correlate a queryNode

Configurazione correlata di queryNode, usata per eseguire una ricerca ibrida tra dati vettoriali e scalari.

queryNode.stats.publishInterval

Descrizione Valore predefinito
L'intervallo in cui il nodo di query pubblica le informazioni statistiche del nodo, tra cui lo stato del segmento, l'uso della cpu, l'uso della memoria, lo stato di salute, ecc. Unità: ms. 1000

queryNode.segcore.knowhereThreadPoolNumRatio

Descrizione Valore predefinito
Il numero di thread nel pool di thread di knowhere. Se il disco è abilitato, la dimensione del pool si moltiplica con knowhereThreadPoolNumRatio([1, 32]). 4

queryNode.segcore.chunkRows

Descrizione Valore predefinito
Numero di righe con cui Segcore divide un segmento in pezzi. 128

queryNode.segcore.interimIndex.enableIndex

Descrizione Valore predefinito
  • Se creare un indice temporaneo per i segmenti in crescita e per i segmenti sigillati non ancora indicizzati, migliorando le prestazioni di ricerca.
  • Milvus finirà per sigillare e indicizzare tutti i segmenti, ma l'attivazione di questa opzione ottimizza le prestazioni di ricerca per le query immediate dopo l'inserimento dei dati.
  • L'impostazione predefinita è true, a indicare che Milvus crea un indice temporaneo per i segmenti in crescita e per i segmenti sigillati che non vengono indicizzati al momento della ricerca.
  • vero

    queryNode.segcore.interimIndex.nlist

    Descrizione Valore predefinito
    indice temporaneo nlist, si consiglia di impostare sqrt(chunkRows), deve essere inferiore a chunkRows/8 128

    queryNode.segcore.interimIndex.nprobe

    Descrizione Valore predefinito
    nprobe per cercare un indice piccolo, in base ai requisiti di precisione, deve essere inferiore a nlist 16

    queryNode.segcore.interimIndex.memExpansionRate

    Descrizione Valore predefinito
    memoria extra necessaria per la costruzione dell'indice intermedio 1.15

    queryNode.segcore.interimIndex.buildParallelRate

    Descrizione Valore predefinito
    rapporto tra la costruzione di un indice intermedio in parallelo e il numero di cpu 0.5

    queryNode.segcore.multipleChunkedEnable

    Descrizione Valore predefinito
    Abilita la ricerca multipla chunked vero

    queryNode.segcore.knowhereScoreConsistency

    Descrizione Valore predefinito
    Abilita la logica di calcolo del punteggio di consistenza forte di Knowhere falso

    queryNode.loadMemoryUsageFactor

    Descrizione Valore predefinito
    Il fattore di moltiplicazione del calcolo dell'uso della memoria durante il caricamento dei segmenti 1

    queryNode.enableDisk

    Descrizione Valore predefinito
    abilita il caricamento dell'indice del disco da parte del querynode e la ricerca sull'indice del disco falso

    queryNode.cache.memoryLimit

    Descrizione Valore predefinito
    2 GB, 2 * 1024 *1024 *1024 2147483648

    queryNode.cache.readAheadPolicy

    Descrizione Valore predefinito
    La politica di lettura anticipata della chunk cache, opzioni: `normale, casuale, sequenziale, willneed, dontneed`. willneed

    queryNode.cache.warmup

    Descrizione Valore predefinito
  • opzioni: async, sync, disable.
  • Specifica la necessità di riscaldare la cache dei chunk.
  • 1. Se si imposta "sync" o "async", i dati vettoriali originali vengono caricati in modo sincrono/asincrono nella chunk cache durante il processo di caricamento.
  • cache dei chunk durante il processo di caricamento. Questo approccio ha il potenziale di ridurre sostanzialmente la latenza delle query e delle ricerche per una durata specifica dopo il caricamento.
  • per una durata specifica dopo il caricamento, anche se accompagnato da un contemporaneo aumento dell'utilizzo del disco;
  • 2. Se impostato su "disable", i dati vettoriali originali saranno caricati nella cache dei chunk solo durante la ricerca/query.
  • disabilitare

    queryNode.mmap.vectorField

    Descrizione Valore predefinito
    Abilita mmap per il caricamento dei dati vettoriali falso

    queryNode.mmap.vectorIndex

    Descrizione Valore predefinito
    Abilita mmap per il caricamento dell'indice del vettore falso

    queryNode.mmap.scalarField

    Descrizione Valore predefinito
    Abilita mmap per il caricamento di dati scalari falso

    queryNode.mmap.scalarIndex

    Descrizione Valore predefinito
    Abilita mmap per il caricamento di indici scalari falso

    queryNode.mmap.chunkCache

    Descrizione Valore predefinito
    Abilita mmap per la cache dei chunk (recupero di vettori grezzi). vero

    queryNode.mmap.growingMmapEnabled

    Descrizione Valore predefinito
  • Abilita la mappatura della memoria (mmap) per ottimizzare la gestione dei dati grezzi in crescita.
  • Attivando questa funzione, l'overhead di memoria associato ai dati aggiunti o modificati sarà significativamente ridotto.
  • Tuttavia, questa ottimizzazione può comportare una leggera diminuzione della latenza delle query per i segmenti di dati interessati.
  • falso

    queryNode.mmap.fixedFileSizeForMmapAlloc

    Descrizione Valore predefinito
    dimensione del file tmp per mmap chunk manager 1

    queryNode.mmap.maxDiskUsagePercentageForMmapAlloc

    Descrizione Valore predefinito
    percentuale di disco utilizzata in mmap chunk manager 50

    queryNode.lazyload.enabled

    Descrizione Valore predefinito
    Abilita il lazyload per il caricamento dei dati falso

    queryNode.lazyload.waitTimeout

    Descrizione Valore predefinito
    timeout massimo di attesa durata in millisecondi prima di iniziare la ricerca e il recupero con lazyload 30000

    queryNode.lazyload.requestResourceTimeout

    Descrizione Valore predefinito
    timeout massimo in millisecondi per l'attesa della risorsa richiesta per il carico pigro, 5s per impostazione predefinita 5000

    queryNode.lazyload.requestResourceRetryInterval

    Descrizione Valore predefinito
    intervallo di riprova in millisecondi per la richiesta di risorsa in attesa per carico pigro, 2s per impostazione predefinita 2000

    queryNode.lazyload.maxRetryTimes

    Descrizione Valore predefinito
    tempi massimi di riprova per il carico pigro, 1 per impostazione predefinita 1

    queryNode.lazyload.maxEvictPerRetry

    Descrizione Valore predefinito
    Numero massimo di sfratti per il carico pigro, 1 per impostazione predefinita 1

    queryNode.indexOffsetCacheEnabled

    Descrizione Valore predefinito
    abilita la cache degli offset dell'indice per alcuni indici scalari, ora è solo per gli indici bitmap, abilitare questo parametro può migliorare le prestazioni per il recupero dei dati grezzi dall'indice falso

    queryNode.scheduler.maxReadConcurrentRatio

    Descrizione Valore predefinito
  • maxReadConcurrentRatio è il rapporto di concorrenza dei task di lettura (task di ricerca e task di interrogazione).
  • La massima concomitanza di lettura è il valore di hardware.GetCPUNum * maxReadConcurrentRatio.
  • L'impostazione predefinita è 2,0, il che significa che la concomitanza massima di lettura sarà il valore di hardware.GetCPUNum * 2.
  • La massima velocità di lettura deve essere maggiore o uguale a 1 e minore o uguale a hardware.GetCPUNum * 100.
  • (0, 100]
  • 1

    queryNode.scheduler.cpuRatio

    Descrizione Valore predefinito
    rapporto utilizzato per stimare l'utilizzo della cpu dei task di lettura. 10

    queryNode.scheduler.scheduleReadPolicy.name

    Descrizione Valore predefinito
  • fifo: Una coda FIFO che supporta la pianificazione.
  • user-task-polling:
  • I task dell'utente vengono interrogati uno per uno e programmati.
  • La pianificazione è equa in base alla granularità dei task.
  • La politica si basa sul nome utente per l'autenticazione.
  • Un nome utente vuoto viene considerato come lo stesso utente.
  • Quando non ci sono più utenti, la politica decade in FIFO".
  • fifo

    queryNode.scheduler.scheduleReadPolicy.taskQueueExpire

    Descrizione Valore predefinito
    Controlla il tempo (molti secondi) in cui la coda viene mantenuta da quando è vuota. 60

    queryNode.scheduler.scheduleReadPolicy.enableCrossUserGrouping

    Descrizione Valore predefinito
    Abilita il raggruppamento trasversale degli utenti quando si usa il criterio di polling dei compiti dell'utente. (Disabilitarlo se le attività dell'utente non possono unirsi l'una all'altra) falso

    queryNode.scheduler.scheduleReadPolicy.maxPendingTaskPerUser

    Descrizione Valore predefinito
    Attività massima in sospeso per utente nello scheduler 1024

    queryNode.levelZeroForwardPolicy

    Descrizione Valore predefinito
    politica di inoltro della cancellazione a livello di delegatore, opzione possibile["FilterByBF", "RemoteLoad"]. FiltroByBF

    queryNode.streamingDeltaForwardPolicy

    Descrizione Valore predefinito
    criterio di inoltro per la cancellazione dello streaming del delegatore, opzione possibile["FilterByBF", "Direct"]. FiltroByBF

    queryNode.dataSync.flowGraph.maxQueueLength

    Descrizione Valore predefinito
    La dimensione massima della cache delle code di attività nel grafo dei flussi nel nodo di interrogazione. 16

    queryNode.dataSync.flowGraph.maxParallelism

    Descrizione Valore predefinito
    Numero massimo di task eseguiti in parallelo nel diagramma di flusso 1024

    queryNode.enableSegmentPrune

    Descrizione Valore predefinito
    utilizza le statistiche di partizione per sfrondare i dati nella ricerca/query sul delegatore di shard falso

    queryNode.queryStreamBatchSize

    Descrizione Valore predefinito
    restituisce la dimensione minima del batch della query di flusso 4194304

    queryNode.queryStreamMaxBatchSize

    Descrizione Valore predefinito
    restituisce la dimensione massima del batch della query di flusso 134217728

    queryNode.bloomFilterApplyParallelFactor

    Descrizione Valore predefinito
    fattore parallelo quando applicare pk al filtro bloom, predefinito a 4*CPU_CORE_NUM 4

    queryNode.workerPooling.size

    Descrizione Valore predefinito
    la dimensione del pool di client del querynode worker 10

    queryNode.ip

    Descrizione Valore predefinito
    Indirizzo TCP/IP del queryNode. Se non viene specificato, viene usato il primo indirizzo non ciclabile.

    queryNode.port

    Descrizione Valore predefinito
    Porta TCP del queryNode 21123

    queryNode.grpc.serverMaxSendSize

    Descrizione Valore predefinito
    Dimensione massima di ogni richiesta RPC che il queryNode può inviare, unità: byte 536870912

    queryNode.grpc.serverMaxRecvSize

    Descrizione Valore predefinito
    La dimensione massima di ogni richiesta RPC che il queryNode può ricevere, unità: byte 268435456

    queryNode.grpc.clientMaxSendSize

    Descrizione Valore predefinito
    La dimensione massima di ogni richiesta RPC che i client del queryNode possono inviare, unità: byte 268435456

    queryNode.grpc.clientMaxRecvSize

    Descrizione Valore predefinito
    La dimensione massima di ogni richiesta RPC che i client su queryNode possono ricevere, unità: byte 536870912
    Tabella dei contenuti

    Try Managed Milvus for Free

    Zilliz Cloud is hassle-free, powered by Milvus and 10x faster.

    Get Started
    Feedback

    Questa pagina è stata utile?