Configuración relacionada de queryNode, utilizada para ejecutar búsquedas híbridas entre datos vectoriales y escalares.
Descripción |
Valor por defecto |
El intervalo en el que el nodo de consulta publica la información estadística del nodo, incluyendo el estado del segmento, uso de cpu, uso de memoria, estado de salud, etc. Unidad: ms. |
1000 |
Descripción |
Valor por Defecto |
El número de hilos en el pool de hilos de knowhere. Si el disco está habilitado, el tamaño del pool se multiplicará por knowhereThreadPoolNumRatio([1, 32]). |
4 |
Descripción |
Valor por Defecto |
Recuento de filas por el que Segcore divide un segmento en trozos. |
128 |
Descripción |
Valor por defecto |
Si crear un índice temporal para segmentos crecientes y segmentos sellados aún no indexados, mejorando el rendimiento de la búsqueda.
Milvus eventualmente sellará e indexará todos los segmentos, pero habilitar esto optimiza el rendimiento de búsqueda para consultas inmediatas después de la inserción de datos.
El valor predeterminado es true, lo que indica que Milvus crea un índice temporal para los segmentos en crecimiento y los segmentos sellados que no se indexan en las búsquedas. |
verdadero |
Descripción |
Valor por defecto |
índice temporal nlist, se recomienda establecer sqrt(chunkRows), debe ser menor que chunkRows/8 |
128 |
Descripción |
Valor por defecto |
nprobe para buscar un índice pequeño, basado en sus requerimientos de precisión, debe ser menor que nlist |
16 |
Descripción |
Valor por defecto |
memoria extra necesaria para construir el índice intermedio |
1.15 |
Descripción |
Valor por defecto |
ratio de construcción de índice intermedio en paralelo con el número de cpu |
0.5 |
Descripción |
Valor por defecto |
Habilitar la lógica de cálculo de la puntuación de consistencia fuerte de knowhere |
falso |
Descripción |
Valor por defecto |
El factor multiplicador del cálculo del uso de memoria mientras se cargan segmentos |
1 |
Descripción |
Valor por defecto |
habilitar querynode cargar índice de disco, y la búsqueda en el índice de disco |
falso |
Descripción |
Valor por defecto |
2 GB, 2 * 1024 *1024 *1024 |
2147483648 |
Descripción |
Valor por defecto |
La política de lectura anticipada de la caché de trozos, opciones: `normal, random, sequential, willneed, dontneed`. |
willneed |
Descripción |
Valor por defecto |
opciones: async, sync, disable.
Especifica la necesidad de calentar la caché de trozos.
1. Si se establece en "sync" o "async", los datos vectoriales originales se cargarán de forma síncrona/asíncrona en la caché de trozos durante el proceso de carga.
caché de trozos durante el proceso de carga. Este enfoque tiene el potencial de reducir sustancialmente la latencia de consulta/búsqueda
durante un tiempo específico tras la carga, aunque acompañado de un aumento simultáneo del uso del disco;
2. Si se establece en "disable" (desactivar), los datos vectoriales originales sólo se cargarán en la caché de trozos durante la búsqueda/consulta. |
desactivar |
Descripción |
Valor por defecto |
Habilita mmap para cargar datos |
false |
Descripción |
Valor por defecto |
Habilitar mmap para utilizar en el crecimiento de datos en bruto |
falso |
Descripción |
Valor por defecto |
Habilitar lazyload para cargar datos |
falso |
Descripción |
Valor por defecto |
max wait timeout duración en milisegundos antes de empezar a hacer la búsqueda y recuperación lazyload |
30000 |
Descripción |
Valor por defecto |
tiempo máximo de espera en milisegundos para la solicitud de recursos para lazy load, 5s por defecto |
5000 |
Descripción |
Valor por defecto |
intervalo de reintento en milisegundos para el recurso de solicitud en espera para carga lenta, 2 s por defecto |
2000 |
Descripción |
Valor por defecto |
tiempo máximo de reintento para carga lenta, 1 por defecto |
1 |
Descripción |
Valor por defecto |
max evict count for lazy load, 1 por defecto |
1 |
Descripción |
Valor por defecto |
maxReadConcurrentRatio es el ratio de concurrencia de la tarea de lectura (tarea de búsqueda y tarea de consulta).
La concurrencia de lectura máxima sería el valor de hardware.GetCPUNum * maxReadConcurrentRatio.
Por defecto es 2.0, lo que significa que la concurrencia máxima de lectura sería el valor de hardware.GetCPUNum * 2.
La concurrencia máxima de lectura debe ser mayor o igual que 1, y menor o igual que hardware.GetCPUNum * 100.
(0, 100] |
1 |
Descripción |
Valor por defecto |
Proporción utilizada para estimar el uso de cpu de la tarea de lectura. |
10 |
Descripción |
Valor por defecto |
fifo: Una cola FIFO soporta la programación.
user-task-polling:
Las tareas del usuario serán sondeadas una a una y programadas.
La programación se basa en la granularidad de las tareas.
La política se basa en el nombre de usuario para la autenticación.
Un nombre de usuario vacío se considera el mismo usuario.
Cuando no hay multiusuarios, la política decae en FIFO". |
fifo |
Descripción |
Valor por defecto |
Controla cuánto tiempo (muchos segundos) retiene la cola desde que se vacía |
60 |
Descripción |
Valor por defecto |
Habilita la agrupación cruzada de usuarios cuando se utiliza la política user-task-polling. (Desactívelo si las tareas de usuario no pueden fusionarse entre sí) |
falso |
Descripción |
Valor por defecto |
Máximo de tareas pendientes por usuario en el planificador |
1024 |
Descripción |
Valor por defecto |
Tamaño máximo de la caché de la cola de tareas en el gráfico de flujo en el nodo de consulta. |
16 |
Descripción |
Valor por defecto |
Número máximo de tareas ejecutadas en paralelo en el grafo de flujo |
1024 |
Descripción |
Valor por defecto |
usar estadísticas de partición para podar datos en búsqueda/consulta en delegador de fragmentos |
falso |
Descripción |
Valor por defecto |
factor paralelo cuando aplicar pk a bloom filter, por defecto 4*CPU_CORE_NUM |
4 |
Descripción |
Valor por defecto |
tamaño del lote de retorno de la consulta de flujo |
4194304 |
Descripción |
Valor por defecto |
el tamaño para el pool de clientes querynode worker |
10 |
Descripción |
Valor por defecto |
Dirección TCP/IP del queryNode. Si no se especifica, utiliza la primera dirección unicastable |
|
Descripción |
Valor por defecto |
Puerto TCP del queryNode |
21123 |
Descripción |
Valor por defecto |
El tamaño máximo de cada petición RPC que el queryNode puede enviar, unidad: byte |
536870912 |
Descripción |
Valor por defecto |
El tamaño máximo de cada petición RPC que el queryNode puede recibir, unidad: byte |
268435456 |
Descripción |
Valor por defecto |
El tamaño máximo de cada petición RPC que los clientes en queryNode pueden enviar, unidad: byte |
268435456 |
Descripción |
Valor por defecto |
El tamaño máximo de cada petición RPC que los clientes en queryNode pueden recibir, unidad: byte |
536870912 |