Configuração relacionada com o queryNode, utilizada para executar uma pesquisa híbrida entre dados vectoriais e escalares.
Descrição |
Valor predefinido |
O intervalo em que o nó de consulta publica as informações estatísticas do nó, incluindo o estado do segmento, a utilização da cpu, a utilização da memória, o estado de saúde, etc. Unidade: ms. |
1000 |
Descrição |
Valor padrão |
O número de threads no pool de threads do knowhere. Se o disco estiver habilitado, o tamanho do pool será multiplicado por knowhereThreadPoolNumRatio([1, 32]). |
4 |
Descrição |
Valor padrão |
Contagem de linhas pela qual o Segcore divide um segmento em pedaços. |
128 |
Descrição |
Valor padrão |
Se deve ser criado um índice temporário para segmentos crescentes e segmentos selados ainda não indexados, melhorando o desempenho da pesquisa.
O Milvus acabará por selar e indexar todos os segmentos, mas a ativação desta opção optimiza o desempenho da pesquisa para consultas imediatas após a inserção de dados.
O padrão é true, indicando que Milvus cria um índice temporário para segmentos crescentes e os segmentos selados que não são indexados nas pesquisas. |
true |
Descrição |
Valor por defeito |
índice temporário nlist, recomendado para definir sqrt(chunkRows), deve ser menor que chunkRows/8 |
128 |
Descrição |
Valor por defeito |
nprobe para procurar um índice pequeno, com base nos seus requisitos de precisão, tem de ser inferior a nlist |
16 |
Descrição |
Valor por defeito |
memória extra necessária para construir um índice provisório |
1.15 |
Descrição |
Valor por defeito |
o rácio da construção do índice provisório em paralelo com o número do CPU |
0.5 |
Descrição |
Valor por defeito |
Ativar a lógica de cálculo da pontuação de consistência forte do knowhere |
falso |
Descrição |
Valor por defeito |
O fator de multiplicação do cálculo da utilização da memória durante o carregamento de segmentos |
1 |
Descrição |
Valor por defeito |
ativar o índice do disco de carregamento do querynode e pesquisar no índice do disco |
falso |
Descrição |
Valor por defeito |
2 GB, 2 * 1024 *1024 *1024 |
2147483648 |
Descrição |
Valor por defeito |
A política de leitura antecipada do cache de pedaços, opções: `normal, random, sequential, willneed, dontneed` |
willneed |
Descrição |
Valor por defeito |
opções: async, sync, disable.
Especifica a necessidade de aquecimento do cache de pedaços.
1. Se definido como "sync" ou "async", os dados vectoriais originais serão carregados de forma síncrona/assíncrona na
cache de pedaços durante o processo de carregamento. Esta abordagem tem o potencial de reduzir substancialmente a latência de consulta/pesquisa
durante um período específico após o carregamento, embora acompanhada de um aumento simultâneo da utilização do disco;
2. Se definido como "disable" (desativar), os dados vectoriais originais só serão carregados para a cache de blocos durante a pesquisa/consulta. |
desativar |
Descrição |
Valor predefinido |
Ativar o mmap para carregar dados |
false |
Descrição |
Valor por defeito |
Ativar a mmap para utilizar dados brutos em crescimento |
false |
Descrição |
Valor por defeito |
Ativar o lazyload para carregar dados |
false |
Descrição |
Valor por defeito |
duração máxima do tempo de espera em milissegundos antes de começar a efetuar a pesquisa e a recuperação do carregamento lento |
30000 |
Descrição |
Valor por defeito |
tempo máximo de espera em milissegundos para aguardar o recurso de pedido de carregamento lento, 5s por defeito |
5000 |
Descrição |
Valor por defeito |
intervalo de repetição em milissegundos para o recurso de pedido em espera para carga lenta, 2s por defeito |
2000 |
Descrição |
Valor por defeito |
tempos máximos de repetição para carga preguiçosa, 1 por predefinição |
1 |
Descrição |
Valor por defeito |
contagem máxima de evacuações para carga preguiçosa, 1 por defeito |
1 |
Descrição |
Valor por defeito |
maxReadConcurrentRatio é o rácio de simultaneidade da tarefa de leitura (tarefa de pesquisa e tarefa de consulta).
A simultaneidade máxima de leitura seria o valor de hardware.GetCPUNum * maxReadConcurrentRatio.
A predefinição é 2,0, o que significa que a simultaneidade máxima de leitura seria o valor de hardware.GetCPUNum * 2.
A simultaneidade máxima de leitura deve ser maior ou igual a 1 e menor ou igual a hardware.GetCPUNum * 100.
(0, 100] |
1 |
Descrição |
Valor predefinido |
rácio utilizado para estimar a utilização do CPU da tarefa de leitura. |
10 |
Descrição |
Valor por defeito |
fifo: Uma fila FIFO suporta o agendamento.
user-task-polling:
As tarefas do utilizador serão sondadas uma a uma e agendadas.
O agendamento é justo na granularidade da tarefa.
A política é baseada no nome de utilizador para autenticação.
E um nome de utilizador vazio é considerado o mesmo utilizador.
Quando não há multi-utilizadores, a política decai para FIFO" |
fifo |
Descrição |
Valor predefinido |
Controla o tempo (muitos segundos) que a fila retém desde que a fila está vazia |
60 |
Descrição |
Valor por defeito |
Ativar o agrupamento de utilizadores cruzados quando se utiliza a política de consulta de tarefas do utilizador. (Desativar se as tarefas do utilizador não se puderem fundir umas com as outras) |
falso |
Descrição |
Valor por defeito |
Máximo de tarefas pendentes por utilizador no agendador |
1024 |
Descrição |
Valor por defeito |
O tamanho máximo da cache da fila de tarefas no gráfico de fluxo no nó de consulta. |
16 |
Descrição |
Valor por defeito |
Número máximo de tarefas executadas em paralelo no grafo de fluxo |
1024 |
Descrição |
Valor por defeito |
utilizar estatísticas de partição para podar dados na pesquisa/consulta no delegador de fragmentos |
falso |
Descrição |
Valor por defeito |
fator paralelo quando aplicar pk ao filtro de floração, predefinição para 4*CPU_CORE_NUM |
4 |
Descrição |
Valor por defeito |
Tamanho do lote de retorno da consulta de fluxo |
4194304 |
Descrição |
Valor por defeito |
o tamanho do conjunto de clientes do querynode de trabalho |
10 |
Descrição |
Valor por defeito |
Endereço TCP/IP do queryNode. Se não for especificado, utilizar o primeiro endereço unicastable |
|
Descrição |
Valor por defeito |
Porta TCP do nó de consulta |
21123 |
Descrição |
Valor por defeito |
O tamanho máximo de cada pedido RPC que o queryNode pode enviar, unidade: byte |
536870912 |
Descrição |
Valor por defeito |
O tamanho máximo de cada pedido RPC que o nó de consulta pode receber, unidade: byte |
268435456 |
Descrição |
Valor por defeito |
O tamanho máximo de cada pedido RPC que os clientes no queryNode podem enviar, unidade: byte |
268435456 |
Descrição |
Valor por defeito |
O tamanho máximo de cada pedido RPC que os clientes no queryNode podem receber, unidade: byte |
536870912 |