Configurazione correlata di queryNode, usata per eseguire una ricerca ibrida tra dati vettoriali e scalari.
Descrizione |
Valore predefinito |
L'intervallo in cui il nodo di query pubblica le informazioni sulle statistiche del nodo, tra cui lo stato del segmento, l'uso della cpu, l'uso della memoria, lo stato di salute, ecc. Unità: ms. |
1000 |
Descrizione |
Valore predefinito |
Il numero di thread nel pool di thread di knowhere. Se il disco è abilitato, la dimensione del pool si moltiplica con knowhereThreadPoolNumRatio([1, 32]). |
4 |
Descrizione |
Valore predefinito |
Numero di righe con cui Segcore divide un segmento in pezzi. |
128 |
Descrizione |
Valore predefinito |
Se creare un indice temporaneo per i segmenti in crescita e per i segmenti sigillati non ancora indicizzati, migliorando le prestazioni di ricerca.
Milvus finirà per sigillare e indicizzare tutti i segmenti, ma l'attivazione di questa opzione ottimizza le prestazioni di ricerca per le query immediate dopo l'inserimento dei dati.
L'impostazione predefinita è true, a indicare che Milvus crea un indice temporaneo per i segmenti in crescita e per i segmenti sigillati che non vengono indicizzati al momento della ricerca. |
vero |
Descrizione |
Valore predefinito |
indice temporaneo nlist, si consiglia di impostare sqrt(chunkRows), deve essere inferiore a chunkRows/8 |
128 |
Descrizione |
Valore predefinito |
nprobe per cercare un indice piccolo, in base ai requisiti di precisione, deve essere inferiore a nlist |
16 |
Descrizione |
Valore predefinito |
memoria extra necessaria per la costruzione dell'indice intermedio |
1.15 |
Descrizione |
Valore predefinito |
rapporto tra la costruzione dell'indice intermedio in parallelo e il numero di cpu |
0.5 |
Descrizione |
Valore predefinito |
Abilita la logica di calcolo del punteggio di consistenza forte di knowhere |
falso |
Descrizione |
Valore predefinito |
Il fattore di moltiplicazione del calcolo dell'utilizzo della memoria durante il caricamento dei segmenti |
1 |
Descrizione |
Valore predefinito |
abilita il caricamento dell'indice del disco da parte del querynode e la ricerca sull'indice del disco |
falso |
Descrizione |
Valore predefinito |
2 GB, 2 * 1024 *1024 *1024 |
2147483648 |
Descrizione |
Valore predefinito |
La politica di lettura anticipata della chunk cache, opzioni: `normale, casuale, sequenziale, willneed, dontneed`. |
willneed |
Descrizione |
Valore predefinito |
opzioni: async, sync, disable.
Specifica la necessità di riscaldare la cache dei chunk.
1. Se si imposta "sync" o "async", i dati vettoriali originali vengono caricati in modo sincrono/asincrono nella chunk cache durante il processo di caricamento.
cache dei chunk durante il processo di caricamento. Questo approccio ha il potenziale di ridurre sostanzialmente la latenza delle query e delle ricerche per una durata specifica dopo il caricamento.
per una durata specifica dopo il caricamento, anche se accompagnato da un contemporaneo aumento dell'utilizzo del disco;
2. Se impostato su "disable", i dati vettoriali originali saranno caricati nella cache dei chunk solo durante la ricerca/query. |
disabilitare |
Descrizione |
Valore predefinito |
Abilita mmap per il caricamento dei dati |
falso |
Descrizione |
Valore predefinito |
Abilita mmap per l'utilizzo di dati grezzi in crescita |
falso |
Descrizione |
Valore predefinito |
Abilita il lazyload per il caricamento dei dati |
falso |
Descrizione |
Valore predefinito |
timeout massimo di attesa durata in millisecondi prima di iniziare la ricerca e il recupero con lazyload |
30000 |
Descrizione |
Valore predefinito |
timeout massimo in millisecondi per l'attesa della risorsa richiesta per il carico pigro, 5s per impostazione predefinita |
5000 |
Descrizione |
Valore predefinito |
intervallo di riprova in millisecondi per la richiesta di risorsa in attesa per carico pigro, 2s per impostazione predefinita |
2000 |
Descrizione |
Valore predefinito |
tempi massimi di riprova per il carico pigro, 1 per impostazione predefinita |
1 |
Descrizione |
Valore predefinito |
Numero massimo di sfratti per il carico pigro, 1 per impostazione predefinita |
1 |
Descrizione |
Valore predefinito |
maxReadConcurrentRatio è il rapporto di concorrenza dei task di lettura (task di ricerca e task di query).
La concurrency massima di lettura è il valore di hardware.GetCPUNum * maxReadConcurrentRatio.
L'impostazione predefinita è 2,0, il che significa che la concomitanza massima di lettura sarà il valore di hardware.GetCPUNum * 2.
La velocità di lettura massima deve essere maggiore o uguale a 1 e minore o uguale a hardware.GetCPUNum * 100.
(0, 100] |
1 |
Descrizione |
Valore predefinito |
rapporto utilizzato per stimare l'utilizzo della cpu dei task di lettura. |
10 |
Descrizione |
Valore predefinito |
fifo: Una coda FIFO che supporta la pianificazione.
user-task-polling:
I task dell'utente vengono interrogati uno per uno e programmati.
La pianificazione è equa in base alla granularità dei task.
La politica si basa sul nome utente per l'autenticazione.
Un nome utente vuoto viene considerato come lo stesso utente.
Quando non ci sono più utenti, la politica decade in FIFO". |
fifo |
Descrizione |
Valore predefinito |
Controlla il tempo (molti secondi) in cui la coda viene mantenuta da quando è vuota. |
60 |
Descrizione |
Valore predefinito |
Abilita il raggruppamento trasversale degli utenti quando si usa il criterio di polling dei compiti dell'utente. (Disabilitarlo se le attività dell'utente non possono unirsi l'una all'altra) |
falso |
Descrizione |
Valore predefinito |
Attività massima in attesa per utente nello scheduler |
1024 |
Descrizione |
Valore predefinito |
Dimensione massima della cache della coda delle attività nel grafico di flusso nel nodo di interrogazione. |
16 |
Descrizione |
Valore predefinito |
Numero massimo di task eseguiti in parallelo nel diagramma di flusso |
1024 |
Descrizione |
Valore predefinito |
usa le statistiche di partizione per sfrondare i dati nella ricerca/query sul delegatore di shard |
falso |
Descrizione |
Valore predefinito |
fattore parallelo quando applicare il pk al filtro bloom, predefinito a 4*CPU_CORE_NUM |
4 |
Descrizione |
Valore predefinito |
dimensione del batch di ritorno della query di flusso |
4194304 |
Descrizione |
Valore predefinito |
la dimensione del pool di client del querynode worker |
10 |
Descrizione |
Valore predefinito |
Indirizzo TCP/IP del queryNode. Se non viene specificato, viene utilizzato il primo indirizzo non ciclabile. |
|
Descrizione |
Valore predefinito |
Porta TCP del queryNode |
21123 |
Descrizione |
Valore predefinito |
Dimensione massima di ogni richiesta RPC che il queryNode può inviare, unità: byte |
536870912 |
Descrizione |
Valore predefinito |
La dimensione massima di ogni richiesta RPC che il queryNode può ricevere, unità: byte |
268435456 |
Descrizione |
Valore predefinito |
La dimensione massima di ogni richiesta RPC che i client del queryNode possono inviare, unità: byte |
268435456 |
Descrizione |
Valore predefinito |
La dimensione massima di ogni richiesta RPC che i client sul queryNode possono ricevere, unità: byte |
536870912 |