Configurazioni correlate a queryNode

Informazioni su Milvus
Iniziare
Concetti
Guida per l'utente
Importazione dei dati
Strumenti AI
Guida all'amministrazione
- Distribuzione
- Configurazione
- Gestire le dipendenze
- Scala
- Aggiornamento
- Monitoraggio, avvisi e registri
- Gruppi di risorse
- Sicurezza
- Milvus WebUI
- Picchio
- Interruttore Tipo MQ
Strumenti
Integrazioni
Tutorial
Domande frequenti
API Reference

Configurazione correlata di queryNode, usata per eseguire una ricerca ibrida tra dati vettoriali e scalari.

`queryNode.stats.publishInterval`

Descrizione	Valore predefinito
L'intervallo in cui il nodo di query pubblica le informazioni sulle statistiche del nodo, tra cui lo stato del segmento, l'uso della cpu, l'uso della memoria, lo stato di salute, ecc. Unità: ms.	1000

`queryNode.segcore.knowhereThreadPoolNumRatio`

Descrizione	Valore predefinito
Il numero di thread nel pool di thread di knowhere. Se il disco è abilitato, la dimensione del pool si moltiplica con knowhereThreadPoolNumRatio([1, 32]).	4

`queryNode.segcore.chunkRows`

Descrizione	Valore predefinito
Numero di righe con cui Segcore divide un segmento in pezzi.	128

`queryNode.segcore.interimIndex.enableIndex`

Descrizione	Valore predefinito
Se creare un indice temporaneo per i segmenti in crescita e per i segmenti sigillati non ancora indicizzati, migliorando le prestazioni di ricerca. Milvus finirà per sigillare e indicizzare tutti i segmenti, ma l'attivazione di questa opzione ottimizza le prestazioni di ricerca per le query immediate dopo l'inserimento dei dati. L'impostazione predefinita è true, a indicare che Milvus crea un indice temporaneo per i segmenti in crescita e per i segmenti sigillati che non vengono indicizzati al momento della ricerca.	vero

Descrizione

Valore predefinito

Se creare un indice temporaneo per i segmenti in crescita e per i segmenti sigillati non ancora indicizzati, migliorando le prestazioni di ricerca.

Milvus finirà per sigillare e indicizzare tutti i segmenti, ma l'attivazione di questa opzione ottimizza le prestazioni di ricerca per le query immediate dopo l'inserimento dei dati.

L'impostazione predefinita è true, a indicare che Milvus crea un indice temporaneo per i segmenti in crescita e per i segmenti sigillati che non vengono indicizzati al momento della ricerca.

vero

`queryNode.segcore.interimIndex.nlist`

Descrizione	Valore predefinito
indice temporaneo nlist, si consiglia di impostare sqrt(chunkRows), deve essere inferiore a chunkRows/8	128

`queryNode.segcore.interimIndex.nprobe`

Descrizione	Valore predefinito
nprobe per cercare un indice piccolo, in base ai requisiti di precisione, deve essere inferiore a nlist	16

`queryNode.segcore.interimIndex.memExpansionRate`

Descrizione	Valore predefinito
memoria extra necessaria per la costruzione dell'indice intermedio	1.15

`queryNode.segcore.interimIndex.buildParallelRate`

Descrizione	Valore predefinito
rapporto tra la costruzione di un indice intermedio in parallelo e il numero di cpu	0.5

`queryNode.segcore.multipleChunkedEnable`

Descrizione	Valore predefinito
Abilita la ricerca multipla chunked	vero

`queryNode.segcore.knowhereScoreConsistency`

Descrizione	Valore predefinito
Abilita la logica di calcolo del punteggio di consistenza forte di Knowhere	falso

`queryNode.loadMemoryUsageFactor`

Descrizione	Valore predefinito
Il fattore di moltiplicazione del calcolo dell'uso della memoria durante il caricamento dei segmenti	1

`queryNode.enableDisk`

Descrizione	Valore predefinito
abilita il caricamento dell'indice del disco da parte del querynode e la ricerca sull'indice del disco	falso

`queryNode.cache.memoryLimit`

Descrizione	Valore predefinito
2 GB, 2 * 1024 1024 1024	2147483648

`queryNode.cache.readAheadPolicy`

Descrizione	Valore predefinito
La politica di lettura anticipata della chunk cache, opzioni: `normale, casuale, sequenziale, willneed, dontneed`.	willneed

`queryNode.cache.warmup`

Descrizione	Valore predefinito
opzioni: async, sync, disable. Specifica la necessità di riscaldare la cache dei chunk. 1. Se si imposta "sync" o "async", i dati vettoriali originali vengono caricati in modo sincrono/asincrono nella chunk cache durante il processo di caricamento. cache dei chunk durante il processo di caricamento. Questo approccio ha il potenziale di ridurre sostanzialmente la latenza delle query e delle ricerche per una durata specifica dopo il caricamento. per una durata specifica dopo il caricamento, anche se accompagnato da un contemporaneo aumento dell'utilizzo del disco; 2. Se impostato su "disable", i dati vettoriali originali saranno caricati nella cache dei chunk solo durante la ricerca/query.	disabilitare

Descrizione

Valore predefinito

opzioni: async, sync, disable.

Specifica la necessità di riscaldare la cache dei chunk.

1. Se si imposta "sync" o "async", i dati vettoriali originali vengono caricati in modo sincrono/asincrono nella chunk cache durante il processo di caricamento.

cache dei chunk durante il processo di caricamento. Questo approccio ha il potenziale di ridurre sostanzialmente la latenza delle query e delle ricerche per una durata specifica dopo il caricamento.

per una durata specifica dopo il caricamento, anche se accompagnato da un contemporaneo aumento dell'utilizzo del disco;

2. Se impostato su "disable", i dati vettoriali originali saranno caricati nella cache dei chunk solo durante la ricerca/query.

disabilitare

`queryNode.mmap.vectorField`

Descrizione	Valore predefinito
Abilita mmap per il caricamento dei dati vettoriali	falso

`queryNode.mmap.vectorIndex`

Descrizione	Valore predefinito
Abilita mmap per il caricamento dell'indice del vettore	falso

`queryNode.mmap.scalarField`

Descrizione	Valore predefinito
Abilita mmap per il caricamento di dati scalari	falso

`queryNode.mmap.scalarIndex`

Descrizione	Valore predefinito
Abilita mmap per il caricamento di indici scalari	falso

`queryNode.mmap.chunkCache`

Descrizione	Valore predefinito
Abilita mmap per la cache dei chunk (recupero di vettori grezzi).	vero

`queryNode.mmap.growingMmapEnabled`

Descrizione	Valore predefinito
Abilita la mappatura della memoria (mmap) per ottimizzare la gestione dei dati grezzi in crescita. Attivando questa funzione, l'overhead di memoria associato ai dati aggiunti o modificati sarà significativamente ridotto. Tuttavia, questa ottimizzazione può comportare una leggera diminuzione della latenza delle query per i segmenti di dati interessati.	falso

`queryNode.mmap.fixedFileSizeForMmapAlloc`

Descrizione	Valore predefinito
dimensione del file tmp per mmap chunk manager	1

`queryNode.mmap.maxDiskUsagePercentageForMmapAlloc`

Descrizione	Valore predefinito
percentuale di disco utilizzata in mmap chunk manager	50

`queryNode.lazyload.enabled`

Descrizione	Valore predefinito
Abilita il lazyload per il caricamento dei dati	falso

`queryNode.lazyload.waitTimeout`

Descrizione	Valore predefinito
timeout massimo di attesa durata in millisecondi prima di iniziare la ricerca e il recupero con lazyload	30000

`queryNode.lazyload.requestResourceTimeout`

Descrizione	Valore predefinito
timeout massimo in millisecondi per l'attesa della risorsa richiesta per il carico pigro, 5s per impostazione predefinita	5000

`queryNode.lazyload.requestResourceRetryInterval`

Descrizione	Valore predefinito
intervallo di riprova in millisecondi per la richiesta di risorsa in attesa per carico pigro, 2s per impostazione predefinita	2000

`queryNode.lazyload.maxRetryTimes`

Descrizione	Valore predefinito
tempi massimi di riprova per il carico pigro, 1 per impostazione predefinita	1

`queryNode.lazyload.maxEvictPerRetry`

Descrizione	Valore predefinito
Numero massimo di sfratti per il carico pigro, 1 per impostazione predefinita	1

`queryNode.indexOffsetCacheEnabled`

Descrizione	Valore predefinito
abilita la cache degli offset dell'indice per alcuni indici scalari, ora è solo per gli indici bitmap, abilitare questo parametro può migliorare le prestazioni per il recupero dei dati grezzi dall'indice	falso

`queryNode.scheduler.maxReadConcurrentRatio`

Descrizione	Valore predefinito
maxReadConcurrentRatio è il rapporto di concorrenza dei task di lettura (task di ricerca e task di interrogazione). La massima concomitanza di lettura è il valore di hardware.GetCPUNum * maxReadConcurrentRatio. L'impostazione predefinita è 2,0, il che significa che la concomitanza massima in lettura sarà il valore di hardware.GetCPUNum * 2. La massima velocità di lettura deve essere maggiore o uguale a 1 e minore o uguale a hardware.GetCPUNum * 100. (0, 100]	1

Descrizione

Valore predefinito

maxReadConcurrentRatio è il rapporto di concorrenza dei task di lettura (task di ricerca e task di interrogazione).

La massima concomitanza di lettura è il valore di hardware.GetCPUNum * maxReadConcurrentRatio.

L'impostazione predefinita è 2,0, il che significa che la concomitanza massima in lettura sarà il valore di hardware.GetCPUNum * 2.

La massima velocità di lettura deve essere maggiore o uguale a 1 e minore o uguale a hardware.GetCPUNum * 100.

(0, 100]

`queryNode.scheduler.cpuRatio`

Descrizione	Valore predefinito
rapporto utilizzato per stimare l'utilizzo della cpu dei task di lettura.	10

`queryNode.scheduler.scheduleReadPolicy.name`

Descrizione	Valore predefinito
fifo: Una coda FIFO che supporta la pianificazione. user-task-polling: I task dell'utente vengono interrogati uno per uno e programmati. La pianificazione è equa in base alla granularità dei task. La politica si basa sul nome utente per l'autenticazione. Un nome utente vuoto viene considerato come lo stesso utente. Quando non ci sono più utenti, la politica decade in FIFO".	fifo

`queryNode.scheduler.scheduleReadPolicy.taskQueueExpire`

Descrizione	Valore predefinito
Controlla il tempo (molti secondi) in cui la coda viene mantenuta da quando è vuota.	60

`queryNode.scheduler.scheduleReadPolicy.enableCrossUserGrouping`

Descrizione	Valore predefinito
Abilita il raggruppamento trasversale degli utenti quando si usa il criterio di polling dei compiti dell'utente. (Disabilitarlo se le attività dell'utente non possono unirsi l'una all'altra)	falso

`queryNode.scheduler.scheduleReadPolicy.maxPendingTaskPerUser`

Descrizione	Valore predefinito
Attività massima in sospeso per utente nello scheduler	1024

`queryNode.levelZeroForwardPolicy`

Descrizione	Valore predefinito
politica di inoltro della cancellazione a livello di delegatore, opzione possibile["FilterByBF", "RemoteLoad"].	FiltroByBF

`queryNode.streamingDeltaForwardPolicy`

Descrizione	Valore predefinito
criterio di inoltro per la cancellazione dello streaming del delegatore, opzione possibile["FilterByBF", "Direct"].	FiltroByBF

`queryNode.dataSync.flowGraph.maxQueueLength`

Descrizione	Valore predefinito
La dimensione massima della cache delle code di attività nel grafo dei flussi nel nodo di interrogazione.	16

`queryNode.dataSync.flowGraph.maxParallelism`

Descrizione	Valore predefinito
Numero massimo di task eseguiti in parallelo nel diagramma di flusso	1024

`queryNode.enableSegmentPrune`

Descrizione	Valore predefinito
usa le statistiche di partizione per sfrondare i dati nella ricerca/query sul delegatore shard	falso

`queryNode.queryStreamBatchSize`

Descrizione	Valore predefinito
restituisce la dimensione minima del batch della query di flusso	4194304

`queryNode.queryStreamMaxBatchSize`

Descrizione	Valore predefinito
restituisce la dimensione massima del batch della query di flusso	134217728

`queryNode.bloomFilterApplyParallelFactor`

Descrizione	Valore predefinito
fattore parallelo quando applicare pk al filtro bloom, predefinito a 4*CPU_CORE_NUM	4

`queryNode.workerPooling.size`

Descrizione	Valore predefinito
la dimensione del pool di client del querynode worker	10

`queryNode.ip`

Descrizione	Valore predefinito
Indirizzo TCP/IP del queryNode. Se non viene specificato, viene utilizzato il primo indirizzo non ciclabile.

`queryNode.port`

Descrizione	Valore predefinito
Porta TCP del queryNode	21123

`queryNode.grpc.serverMaxSendSize`

Descrizione	Valore predefinito
Dimensione massima di ogni richiesta RPC che il queryNode può inviare, unità: byte	536870912

`queryNode.grpc.serverMaxRecvSize`

Descrizione	Valore predefinito
La dimensione massima di ogni richiesta RPC che il queryNode può ricevere, unità: byte	268435456

`queryNode.grpc.clientMaxSendSize`

Descrizione	Valore predefinito
La dimensione massima di ogni richiesta RPC che i client del queryNode possono inviare, unità: byte	268435456

`queryNode.grpc.clientMaxRecvSize`

Descrizione	Valore predefinito
La dimensione massima di ogni richiesta RPC che i client su queryNode possono ricevere, unità: byte	536870912

Tabella dei contenuti

Configurazioni correlate a queryNode
queryNode.stats.publishInterval
queryNode.segcore.knowhereThreadPoolNumRatio
queryNode.segcore.chunkRows
queryNode.segcore.interimIndex.enableIndex
queryNode.segcore.interimIndex.nlist
queryNode.segcore.interimIndex.nprobe
queryNode.segcore.interimIndex.memExpansionRate
queryNode.segcore.interimIndex.buildParallelRate
queryNode.segcore.multipleChunkedEnable
queryNode.segcore.knowhereScoreConsistency
queryNode.loadMemoryUsageFactor
queryNode.enableDisk
queryNode.cache.memoryLimit
queryNode.cache.readAheadPolicy
queryNode.cache.warmup
queryNode.mmap.vectorField
queryNode.mmap.vectorIndex
queryNode.mmap.scalarField
queryNode.mmap.scalarIndex
queryNode.mmap.chunkCache
queryNode.mmap.growingMmapEnabled
queryNode.mmap.fixedFileSizeForMmapAlloc
queryNode.mmap.maxDiskUsagePercentageForMmapAlloc
queryNode.lazyload.enabled
queryNode.lazyload.waitTimeout
queryNode.lazyload.requestResourceTimeout
queryNode.lazyload.requestResourceRetryInterval
queryNode.lazyload.maxRetryTimes
queryNode.lazyload.maxEvictPerRetry
queryNode.indexOffsetCacheEnabled
queryNode.scheduler.maxReadConcurrentRatio
queryNode.scheduler.cpuRatio
queryNode.scheduler.scheduleReadPolicy.name
queryNode.scheduler.scheduleReadPolicy.taskQueueExpire
queryNode.scheduler.scheduleReadPolicy.enableCrossUserGrouping
queryNode.scheduler.scheduleReadPolicy.maxPendingTaskPerUser
queryNode.levelZeroForwardPolicy
queryNode.streamingDeltaForwardPolicy
queryNode.dataSync.flowGraph.maxQueueLength
queryNode.dataSync.flowGraph.maxParallelism
queryNode.enableSegmentPrune
queryNode.queryStreamBatchSize
queryNode.queryStreamMaxBatchSize
queryNode.bloomFilterApplyParallelFactor
queryNode.workerPooling.size
queryNode.ip
queryNode.port
queryNode.grpc.serverMaxSendSize
queryNode.grpc.serverMaxRecvSize
queryNode.grpc.clientMaxSendSize
queryNode.grpc.clientMaxRecvSize

Try Managed Milvus for Free

Zilliz Cloud is hassle-free, powered by Milvus and 10x faster.

Get Started

Feedback

Questa pagina è stata utile?