milvus-logo
LFAI
Home
  • Guía de administración

Configuraciones relacionadas con queryNode

Configuración relacionada de queryNode, utilizada para ejecutar búsquedas híbridas entre datos vectoriales y escalares.

queryNode.stats.publishInterval

Descripción Valor por defecto
El intervalo en el que el nodo de consulta publica la información estadística del nodo, incluyendo el estado del segmento, uso de cpu, uso de memoria, estado de salud, etc. Unidad: ms. 1000

queryNode.segcore.knowhereThreadPoolNumRatio

Descripción Valor por Defecto
El número de hilos en el pool de hilos de knowhere. Si el disco está habilitado, el tamaño del pool se multiplicará por knowhereThreadPoolNumRatio([1, 32]). 4

queryNode.segcore.chunkRows

Descripción Valor por Defecto
Recuento de filas por el que Segcore divide un segmento en trozos. 128

queryNode.segcore.interimIndex.enableIndex

Descripción Valor por defecto
  • Si crear un índice temporal para segmentos crecientes y segmentos sellados aún no indexados, mejorando el rendimiento de la búsqueda.
  • Milvus eventualmente sellará e indexará todos los segmentos, pero habilitar esto optimiza el rendimiento de búsqueda para consultas inmediatas después de la inserción de datos.
  • El valor predeterminado es true, lo que indica que Milvus crea un índice temporal para los segmentos en crecimiento y los segmentos sellados que no se indexan en las búsquedas.
  • verdadero

    queryNode.segcore.interimIndex.nlist

    Descripción Valor por defecto
    índice temporal nlist, se recomienda establecer sqrt(chunkRows), debe ser menor que chunkRows/8 128

    queryNode.segcore.interimIndex.nprobe

    Descripción Valor por defecto
    nprobe para buscar un índice pequeño, basado en sus requerimientos de precisión, debe ser menor que nlist 16

    queryNode.segcore.interimIndex.memExpansionRate

    Descripción Valor por defecto
    memoria extra necesaria para construir el índice intermedio 1.15

    queryNode.segcore.interimIndex.buildParallelRate

    Descripción Valor por defecto
    ratio de construcción de índice intermedio en paralelo con el número de cpu 0.5

    queryNode.segcore.knowhereScoreConsistency

    Descripción Valor por defecto
    Habilitar la lógica de cálculo de la puntuación de consistencia fuerte de knowhere falso

    queryNode.loadMemoryUsageFactor

    Descripción Valor por defecto
    El factor multiplicador del cálculo del uso de memoria mientras se cargan segmentos 1

    queryNode.enableDisk

    Descripción Valor por defecto
    habilitar querynode cargar índice de disco, y la búsqueda en el índice de disco falso

    queryNode.cache.memoryLimit

    Descripción Valor por defecto
    2 GB, 2 * 1024 *1024 *1024 2147483648

    queryNode.cache.readAheadPolicy

    Descripción Valor por defecto
    La política de lectura anticipada de la caché de trozos, opciones: `normal, random, sequential, willneed, dontneed`. willneed

    queryNode.cache.warmup

    Descripción Valor por defecto
  • opciones: async, sync, disable.
  • Especifica la necesidad de calentar la caché de trozos.
  • 1. Si se establece en "sync" o "async", los datos vectoriales originales se cargarán de forma síncrona/asíncrona en la caché de trozos durante el proceso de carga.
  • caché de trozos durante el proceso de carga. Este enfoque tiene el potencial de reducir sustancialmente la latencia de consulta/búsqueda
  • durante un tiempo específico tras la carga, aunque acompañado de un aumento simultáneo del uso del disco;
  • 2. Si se establece en "disable" (desactivar), los datos vectoriales originales sólo se cargarán en la caché de trozos durante la búsqueda/consulta.
  • desactivar

    queryNode.mmap.mmapEnabled

    Descripción Valor por defecto
    Habilita mmap para cargar datos false

    queryNode.mmap.growingMmapEnabled

    Descripción Valor por defecto
    Habilitar mmap para utilizar en el crecimiento de datos en bruto falso

    queryNode.mmap.fixedFileSizeForMmapAlloc

    Descripción Valor por defecto
    Tamaño del fichero tmp para el gestor de chunk mmap 1

    queryNode.mmap.maxDiskUsagePercentageForMmapAlloc

    Descripción Valor por defecto
    porcentaje de disco usado en mmap chunk manager 50

    queryNode.lazyload.enabled

    Descripción Valor por defecto
    Habilitar lazyload para cargar datos falso

    queryNode.lazyload.waitTimeout

    Descripción Valor por defecto
    max wait timeout duración en milisegundos antes de empezar a hacer la búsqueda y recuperación lazyload 30000

    queryNode.lazyload.requestResourceTimeout

    Descripción Valor por defecto
    tiempo máximo de espera en milisegundos para la solicitud de recursos para lazy load, 5s por defecto 5000

    queryNode.lazyload.requestResourceRetryInterval

    Descripción Valor por defecto
    intervalo de reintento en milisegundos para el recurso de solicitud en espera para carga lenta, 2 s por defecto 2000

    queryNode.lazyload.maxRetryTimes

    Descripción Valor por defecto
    tiempo máximo de reintento para carga lenta, 1 por defecto 1

    queryNode.lazyload.maxEvictPerRetry

    Descripción Valor por defecto
    max evict count for lazy load, 1 por defecto 1

    queryNode.scheduler.maxReadConcurrentRatio

    Descripción Valor por defecto
  • maxReadConcurrentRatio es el ratio de concurrencia de la tarea de lectura (tarea de búsqueda y tarea de consulta).
  • La concurrencia de lectura máxima sería el valor de hardware.GetCPUNum * maxReadConcurrentRatio.
  • Por defecto es 2.0, lo que significa que la concurrencia máxima de lectura sería el valor de hardware.GetCPUNum * 2.
  • La concurrencia máxima de lectura debe ser mayor o igual que 1, y menor o igual que hardware.GetCPUNum * 100.
  • (0, 100]
  • 1

    queryNode.scheduler.cpuRatio

    Descripción Valor por defecto
    Proporción utilizada para estimar el uso de cpu de la tarea de lectura. 10

    queryNode.scheduler.scheduleReadPolicy.name

    Descripción Valor por defecto
  • fifo: Una cola FIFO soporta la programación.
  • user-task-polling:
  • Las tareas del usuario serán sondeadas una a una y programadas.
  • La programación se basa en la granularidad de las tareas.
  • La política se basa en el nombre de usuario para la autenticación.
  • Un nombre de usuario vacío se considera el mismo usuario.
  • Cuando no hay multiusuarios, la política decae en FIFO".
  • fifo

    queryNode.scheduler.scheduleReadPolicy.taskQueueExpire

    Descripción Valor por defecto
    Controla cuánto tiempo (muchos segundos) retiene la cola desde que se vacía 60

    queryNode.scheduler.scheduleReadPolicy.enableCrossUserGrouping

    Descripción Valor por defecto
    Habilita la agrupación cruzada de usuarios cuando se utiliza la política user-task-polling. (Desactívelo si las tareas de usuario no pueden fusionarse entre sí) falso

    queryNode.scheduler.scheduleReadPolicy.maxPendingTaskPerUser

    Descripción Valor por defecto
    Máximo de tareas pendientes por usuario en el planificador 1024

    queryNode.dataSync.flowGraph.maxQueueLength

    Descripción Valor por defecto
    Tamaño máximo de la caché de la cola de tareas en el gráfico de flujo en el nodo de consulta. 16

    queryNode.dataSync.flowGraph.maxParallelism

    Descripción Valor por defecto
    Número máximo de tareas ejecutadas en paralelo en el grafo de flujo 1024

    queryNode.enableSegmentPrune

    Descripción Valor por defecto
    usar estadísticas de partición para podar datos en búsqueda/consulta en delegador de fragmentos falso

    queryNode.bloomFilterApplyParallelFactor

    Descripción Valor por defecto
    factor paralelo cuando aplicar pk a bloom filter, por defecto 4*CPU_CORE_NUM 4

    queryNode.queryStreamBatchSize

    Descripción Valor por defecto
    tamaño del lote de retorno de la consulta de flujo 4194304

    queryNode.workerPooling.size

    Descripción Valor por defecto
    el tamaño para el pool de clientes querynode worker 10

    queryNode.ip

    Descripción Valor por defecto
    Dirección TCP/IP del queryNode. Si no se especifica, utiliza la primera dirección unicastable

    queryNode.port

    Descripción Valor por defecto
    Puerto TCP del queryNode 21123

    queryNode.grpc.serverMaxSendSize

    Descripción Valor por defecto
    El tamaño máximo de cada petición RPC que el queryNode puede enviar, unidad: byte 536870912

    queryNode.grpc.serverMaxRecvSize

    Descripción Valor por defecto
    El tamaño máximo de cada petición RPC que el queryNode puede recibir, unidad: byte 268435456

    queryNode.grpc.clientMaxSendSize

    Descripción Valor por defecto
    El tamaño máximo de cada petición RPC que los clientes en queryNode pueden enviar, unidad: byte 268435456

    queryNode.grpc.clientMaxRecvSize

    Descripción Valor por defecto
    El tamaño máximo de cada petición RPC que los clientes en queryNode pueden recibir, unidad: byte 536870912

    Traducido porDeepLogo

    Tabla de contenidos
    Feedback

    ¿Fue útil esta página?