milvus-logo
LFAI
Home
  • Guia de Administração

Configurações relacionadas com o queryNode

Configuração relacionada com o queryNode, utilizada para executar uma pesquisa híbrida entre dados vectoriais e escalares.

queryNode.stats.publishInterval

Descrição Valor predefinido
O intervalo em que o nó de consulta publica as informações estatísticas do nó, incluindo o estado do segmento, a utilização da cpu, a utilização da memória, o estado de saúde, etc. Unidade: ms. 1000

queryNode.segcore.knowhereThreadPoolNumRatio

Descrição Valor padrão
O número de threads no pool de threads do knowhere. Se o disco estiver habilitado, o tamanho do pool será multiplicado por knowhereThreadPoolNumRatio([1, 32]). 4

queryNode.segcore.chunkRows

Descrição Valor padrão
Contagem de linhas pela qual o Segcore divide um segmento em pedaços. 128

queryNode.segcore.interimIndex.enableIndex

Descrição Valor padrão
  • Se deve ser criado um índice temporário para segmentos crescentes e segmentos selados ainda não indexados, melhorando o desempenho da pesquisa.
  • O Milvus acabará por selar e indexar todos os segmentos, mas a ativação desta opção optimiza o desempenho da pesquisa para consultas imediatas após a inserção de dados.
  • O padrão é true, indicando que Milvus cria um índice temporário para segmentos crescentes e os segmentos selados que não são indexados nas pesquisas.
  • true

    queryNode.segcore.interimIndex.nlist

    Descrição Valor por defeito
    índice temporário nlist, recomendado para definir sqrt(chunkRows), deve ser menor que chunkRows/8 128

    queryNode.segcore.interimIndex.nprobe

    Descrição Valor por defeito
    nprobe para procurar um índice pequeno, com base nos seus requisitos de precisão, tem de ser inferior a nlist 16

    queryNode.segcore.interimIndex.memExpansionRate

    Descrição Valor por defeito
    memória extra necessária para construir um índice provisório 1.15

    queryNode.segcore.interimIndex.buildParallelRate

    Descrição Valor por defeito
    o rácio da construção do índice provisório em paralelo com o número do CPU 0.5

    queryNode.segcore.knowhereScoreConsistency

    Descrição Valor por defeito
    Ativar a lógica de cálculo da pontuação de consistência forte do knowhere falso

    queryNode.loadMemoryUsageFactor

    Descrição Valor por defeito
    O fator de multiplicação do cálculo da utilização da memória durante o carregamento de segmentos 1

    queryNode.enableDisk

    Descrição Valor por defeito
    ativar o índice do disco de carregamento do querynode e pesquisar no índice do disco falso

    queryNode.cache.memoryLimit

    Descrição Valor por defeito
    2 GB, 2 * 1024 *1024 *1024 2147483648

    queryNode.cache.readAheadPolicy

    Descrição Valor por defeito
    A política de leitura antecipada do cache de pedaços, opções: `normal, random, sequential, willneed, dontneed` willneed

    queryNode.cache.warmup

    Descrição Valor por defeito
  • opções: async, sync, disable.
  • Especifica a necessidade de aquecimento do cache de pedaços.
  • 1. Se definido como "sync" ou "async", os dados vectoriais originais serão carregados de forma síncrona/assíncrona na
  • cache de pedaços durante o processo de carregamento. Esta abordagem tem o potencial de reduzir substancialmente a latência de consulta/pesquisa
  • durante um período específico após o carregamento, embora acompanhada de um aumento simultâneo da utilização do disco;
  • 2. Se definido como "disable" (desativar), os dados vectoriais originais só serão carregados para a cache de blocos durante a pesquisa/consulta.
  • desativar

    queryNode.mmap.mmapEnabled

    Descrição Valor predefinido
    Ativar o mmap para carregar dados false

    queryNode.mmap.growingMmapEnabled

    Descrição Valor por defeito
    Ativar a mmap para utilizar dados brutos em crescimento false

    queryNode.mmap.fixedFileSizeForMmapAlloc

    Descrição Valor por defeito
    Tamanho do ficheiro tmp para o gestor de blocos do mmap 1

    queryNode.mmap.maxDiskUsagePercentageForMmapAlloc

    Descrição Valor por defeito
    percentagem de disco utilizada no gestor de blocos do mmap 50

    queryNode.lazyload.enabled

    Descrição Valor por defeito
    Ativar o lazyload para carregar dados false

    queryNode.lazyload.waitTimeout

    Descrição Valor por defeito
    duração máxima do tempo de espera em milissegundos antes de começar a efetuar a pesquisa e a recuperação do carregamento lento 30000

    queryNode.lazyload.requestResourceTimeout

    Descrição Valor por defeito
    tempo máximo de espera em milissegundos para aguardar o recurso de pedido de carregamento lento, 5s por defeito 5000

    queryNode.lazyload.requestResourceRetryInterval

    Descrição Valor por defeito
    intervalo de repetição em milissegundos para o recurso de pedido em espera para carga lenta, 2s por defeito 2000

    queryNode.lazyload.maxRetryTimes

    Descrição Valor por defeito
    tempos máximos de repetição para carga preguiçosa, 1 por predefinição 1

    queryNode.lazyload.maxEvictPerRetry

    Descrição Valor por defeito
    contagem máxima de evacuações para carga preguiçosa, 1 por defeito 1

    queryNode.scheduler.maxReadConcurrentRatio

    Descrição Valor por defeito
  • maxReadConcurrentRatio é o rácio de simultaneidade da tarefa de leitura (tarefa de pesquisa e tarefa de consulta).
  • A simultaneidade máxima de leitura seria o valor de hardware.GetCPUNum * maxReadConcurrentRatio.
  • A predefinição é 2,0, o que significa que a simultaneidade máxima de leitura seria o valor de hardware.GetCPUNum * 2.
  • A simultaneidade máxima de leitura deve ser maior ou igual a 1 e menor ou igual a hardware.GetCPUNum * 100.
  • (0, 100]
  • 1

    queryNode.scheduler.cpuRatio

    Descrição Valor predefinido
    rácio utilizado para estimar a utilização do CPU da tarefa de leitura. 10

    queryNode.scheduler.scheduleReadPolicy.name

    Descrição Valor por defeito
  • fifo: Uma fila FIFO suporta o agendamento.
  • user-task-polling:
  • As tarefas do utilizador serão sondadas uma a uma e agendadas.
  • O agendamento é justo na granularidade da tarefa.
  • A política é baseada no nome de utilizador para autenticação.
  • E um nome de utilizador vazio é considerado o mesmo utilizador.
  • Quando não há multi-utilizadores, a política decai para FIFO"
  • fifo

    queryNode.scheduler.scheduleReadPolicy.taskQueueExpire

    Descrição Valor predefinido
    Controla o tempo (muitos segundos) que a fila retém desde que a fila está vazia 60

    queryNode.scheduler.scheduleReadPolicy.enableCrossUserGrouping

    Descrição Valor por defeito
    Ativar o agrupamento de utilizadores cruzados quando se utiliza a política de consulta de tarefas do utilizador. (Desativar se as tarefas do utilizador não se puderem fundir umas com as outras) falso

    queryNode.scheduler.scheduleReadPolicy.maxPendingTaskPerUser

    Descrição Valor por defeito
    Máximo de tarefas pendentes por utilizador no agendador 1024

    queryNode.dataSync.flowGraph.maxQueueLength

    Descrição Valor por defeito
    O tamanho máximo da cache da fila de tarefas no gráfico de fluxo no nó de consulta. 16

    queryNode.dataSync.flowGraph.maxParallelism

    Descrição Valor por defeito
    Número máximo de tarefas executadas em paralelo no grafo de fluxo 1024

    queryNode.enableSegmentPrune

    Descrição Valor por defeito
    utilizar estatísticas de partição para podar dados na pesquisa/consulta no delegador de fragmentos falso

    queryNode.bloomFilterApplyParallelFactor

    Descrição Valor por defeito
    fator paralelo quando aplicar pk ao filtro de floração, predefinição para 4*CPU_CORE_NUM 4

    queryNode.queryStreamBatchSize

    Descrição Valor por defeito
    Tamanho do lote de retorno da consulta de fluxo 4194304

    queryNode.workerPooling.size

    Descrição Valor por defeito
    o tamanho do conjunto de clientes do querynode de trabalho 10

    queryNode.ip

    Descrição Valor por defeito
    Endereço TCP/IP do queryNode. Se não for especificado, utilizar o primeiro endereço unicastable

    queryNode.port

    Descrição Valor por defeito
    Porta TCP do nó de consulta 21123

    queryNode.grpc.serverMaxSendSize

    Descrição Valor por defeito
    O tamanho máximo de cada pedido RPC que o queryNode pode enviar, unidade: byte 536870912

    queryNode.grpc.serverMaxRecvSize

    Descrição Valor por defeito
    O tamanho máximo de cada pedido RPC que o nó de consulta pode receber, unidade: byte 268435456

    queryNode.grpc.clientMaxSendSize

    Descrição Valor por defeito
    O tamanho máximo de cada pedido RPC que os clientes no queryNode podem enviar, unidade: byte 268435456

    queryNode.grpc.clientMaxRecvSize

    Descrição Valor por defeito
    O tamanho máximo de cada pedido RPC que os clientes no queryNode podem receber, unidade: byte 536870912

    Traduzido porDeepLogo

    Tabela de conteúdos
    Feedback

    Esta página foi útil?