Configurazione correlata di queryNode, usata per eseguire una ricerca ibrida tra dati vettoriali e scalari.
Descrizione |
Valore predefinito |
L'intervallo in cui il nodo di query pubblica le informazioni statistiche del nodo, tra cui lo stato del segmento, l'uso della cpu, l'uso della memoria, lo stato di salute, ecc. Unità : ms. |
1000 |
Descrizione |
Valore predefinito |
Il numero di thread nel pool di thread di knowhere. Se il disco è abilitato, la dimensione del pool si moltiplica con knowhereThreadPoolNumRatio([1, 32]). |
4 |
Descrizione |
Valore predefinito |
Numero di righe con cui Segcore divide un segmento in pezzi. |
128 |
Descrizione |
Valore predefinito |
Se creare un indice temporaneo per i segmenti in crescita e per i segmenti sigillati non ancora indicizzati, migliorando le prestazioni di ricerca.
Milvus finirà per sigillare e indicizzare tutti i segmenti, ma l'attivazione di questa opzione ottimizza le prestazioni di ricerca per le query immediate dopo l'inserimento dei dati.
L'impostazione predefinita è true, a indicare che Milvus crea un indice temporaneo per i segmenti in crescita e per i segmenti sigillati che non vengono indicizzati al momento della ricerca. |
vero |
Descrizione |
Valore predefinito |
indice temporaneo nlist, si consiglia di impostare sqrt(chunkRows), deve essere inferiore a chunkRows/8 |
128 |
Descrizione |
Valore predefinito |
nprobe per cercare un indice piccolo, in base ai requisiti di precisione, deve essere inferiore a nlist |
16 |
Descrizione |
Valore predefinito |
memoria extra necessaria per la costruzione dell'indice intermedio |
1.15 |
Descrizione |
Valore predefinito |
rapporto tra la costruzione di un indice intermedio in parallelo e il numero di cpu |
0.5 |
Descrizione |
Valore predefinito |
Abilita la ricerca multipla chunked |
vero |
Descrizione |
Valore predefinito |
Abilita la logica di calcolo del punteggio di consistenza forte di Knowhere |
falso |
Descrizione |
Valore predefinito |
Il fattore di moltiplicazione del calcolo dell'uso della memoria durante il caricamento dei segmenti |
1 |
Descrizione |
Valore predefinito |
abilita il caricamento dell'indice del disco da parte del querynode e la ricerca sull'indice del disco |
falso |
Descrizione |
Valore predefinito |
2 GB, 2 * 1024 *1024 *1024 |
2147483648 |
Descrizione |
Valore predefinito |
La politica di lettura anticipata della chunk cache, opzioni: `normale, casuale, sequenziale, willneed, dontneed`. |
willneed |
Descrizione |
Valore predefinito |
opzioni: async, sync, disable.
Specifica la necessità di riscaldare la cache dei chunk.
1. Se si imposta "sync" o "async", i dati vettoriali originali vengono caricati in modo sincrono/asincrono nella chunk cache durante il processo di caricamento.
cache dei chunk durante il processo di caricamento. Questo approccio ha il potenziale di ridurre sostanzialmente la latenza delle query e delle ricerche per una durata specifica dopo il caricamento.
per una durata specifica dopo il caricamento, anche se accompagnato da un contemporaneo aumento dell'utilizzo del disco;
2. Se impostato su "disable", i dati vettoriali originali saranno caricati nella cache dei chunk solo durante la ricerca/query. |
disabilitare |
Descrizione |
Valore predefinito |
Abilita mmap per il caricamento dei dati vettoriali |
falso |
Descrizione |
Valore predefinito |
Abilita mmap per il caricamento dell'indice del vettore |
falso |
Descrizione |
Valore predefinito |
Abilita mmap per il caricamento di dati scalari |
falso |
Descrizione |
Valore predefinito |
Abilita mmap per il caricamento di indici scalari |
falso |
Descrizione |
Valore predefinito |
Abilita mmap per la cache dei chunk (recupero di vettori grezzi). |
vero |
Descrizione |
Valore predefinito |
Abilita la mappatura della memoria (mmap) per ottimizzare la gestione dei dati grezzi in crescita.
Attivando questa funzione, l'overhead di memoria associato ai dati aggiunti o modificati sarà significativamente ridotto.
Tuttavia, questa ottimizzazione può comportare una leggera diminuzione della latenza delle query per i segmenti di dati interessati. |
falso |
Descrizione |
Valore predefinito |
Abilita il lazyload per il caricamento dei dati |
falso |
Descrizione |
Valore predefinito |
timeout massimo di attesa durata in millisecondi prima di iniziare la ricerca e il recupero con lazyload |
30000 |
Descrizione |
Valore predefinito |
timeout massimo in millisecondi per l'attesa della risorsa richiesta per il carico pigro, 5s per impostazione predefinita |
5000 |
Descrizione |
Valore predefinito |
intervallo di riprova in millisecondi per la richiesta di risorsa in attesa per carico pigro, 2s per impostazione predefinita |
2000 |
Descrizione |
Valore predefinito |
tempi massimi di riprova per il carico pigro, 1 per impostazione predefinita |
1 |
Descrizione |
Valore predefinito |
Numero massimo di sfratti per il carico pigro, 1 per impostazione predefinita |
1 |
Descrizione |
Valore predefinito |
abilita la cache degli offset dell'indice per alcuni indici scalari, ora è solo per gli indici bitmap, abilitare questo parametro può migliorare le prestazioni per il recupero dei dati grezzi dall'indice |
falso |
Descrizione |
Valore predefinito |
maxReadConcurrentRatio è il rapporto di concorrenza dei task di lettura (task di ricerca e task di interrogazione).
La massima concomitanza di lettura è il valore di hardware.GetCPUNum * maxReadConcurrentRatio.
L'impostazione predefinita è 2,0, il che significa che la concomitanza massima di lettura sarà il valore di hardware.GetCPUNum * 2.
La massima velocità di lettura deve essere maggiore o uguale a 1 e minore o uguale a hardware.GetCPUNum * 100.
(0, 100] |
1 |
Descrizione |
Valore predefinito |
rapporto utilizzato per stimare l'utilizzo della cpu dei task di lettura. |
10 |
Descrizione |
Valore predefinito |
fifo: Una coda FIFO che supporta la pianificazione.
user-task-polling:
I task dell'utente vengono interrogati uno per uno e programmati.
La pianificazione è equa in base alla granularità dei task.
La politica si basa sul nome utente per l'autenticazione.
Un nome utente vuoto viene considerato come lo stesso utente.
Quando non ci sono più utenti, la politica decade in FIFO". |
fifo |
Descrizione |
Valore predefinito |
Controlla il tempo (molti secondi) in cui la coda viene mantenuta da quando è vuota. |
60 |
Descrizione |
Valore predefinito |
Abilita il raggruppamento trasversale degli utenti quando si usa il criterio di polling dei compiti dell'utente. (Disabilitarlo se le attività dell'utente non possono unirsi l'una all'altra) |
falso |
Descrizione |
Valore predefinito |
Attività massima in sospeso per utente nello scheduler |
1024 |
Descrizione |
Valore predefinito |
politica di inoltro della cancellazione a livello di delegatore, opzione possibile["FilterByBF", "RemoteLoad"]. |
FiltroByBF |
Descrizione |
Valore predefinito |
criterio di inoltro per la cancellazione dello streaming del delegatore, opzione possibile["FilterByBF", "Direct"]. |
FiltroByBF |
Descrizione |
Valore predefinito |
La dimensione massima della cache delle code di attività nel grafo dei flussi nel nodo di interrogazione. |
16 |
Descrizione |
Valore predefinito |
Numero massimo di task eseguiti in parallelo nel diagramma di flusso |
1024 |
Descrizione |
Valore predefinito |
utilizza le statistiche di partizione per sfrondare i dati nella ricerca/query sul delegatore di shard |
falso |
Descrizione |
Valore predefinito |
restituisce la dimensione minima del batch della query di flusso |
4194304 |
Descrizione |
Valore predefinito |
restituisce la dimensione massima del batch della query di flusso |
134217728 |
Descrizione |
Valore predefinito |
fattore parallelo quando applicare pk al filtro bloom, predefinito a 4*CPU_CORE_NUM |
4 |
Descrizione |
Valore predefinito |
la dimensione del pool di client del querynode worker |
10 |
Descrizione |
Valore predefinito |
Indirizzo TCP/IP del queryNode. Se non viene specificato, viene usato il primo indirizzo non ciclabile. |
|
Descrizione |
Valore predefinito |
Porta TCP del queryNode |
21123 |
Descrizione |
Valore predefinito |
Dimensione massima di ogni richiesta RPC che il queryNode può inviare, unità : byte |
536870912 |
Descrizione |
Valore predefinito |
La dimensione massima di ogni richiesta RPC che il queryNode può ricevere, unità : byte |
268435456 |
Descrizione |
Valore predefinito |
La dimensione massima di ogni richiesta RPC che i client del queryNode possono inviare, unità : byte |
268435456 |
Descrizione |
Valore predefinito |
La dimensione massima di ogni richiesta RPC che i client su queryNode possono ricevere, unità : byte |
536870912 |