milvus-logo
LFAI
Home
  • Guia de Administração

Painel de Métricas do Milvus

O Milvus gera uma lista de métricas detalhadas de séries temporais durante o tempo de execução. Você pode usar o Prometheus e o Grafana para visualizar as métricas. Este tópico apresenta as métricas de monitoramento exibidas no Grafana Milvus Dashboard.

A unidade de tempo neste tópico é milissegundos. E "percentil 99" neste tópico refere-se ao fato de que 99% das estatísticas de tempo são controladas dentro de um determinado valor.

Recomendamos a leitura da visão geral da estrutura de monitoramento do Milvus para entender primeiro as métricas do Prometheus.

Proxy

PainelDescrição do painelPromQL (linguagem de consulta do Prometheus)As métricas do Milvus usadasDescrição das métricas do Milvus
Taxa de contagem de vetores de pesquisaO número médio de vectores consultados por segundo por cada proxy nos últimos dois minutos.sum(increase(milvus_proxy_search_vectors_count{app_kubernetes_io_instance=~"$instance", app_kubernetes_io_name="$app_name", namespace="$namespace"}[2m])/120) by (pod, node_id)milvus_proxy_search_vectors_countO número acumulado de vectores consultados.
Taxa de contagem de vectores de inserçãoO número médio de vectores inseridos por segundo por cada proxy nos últimos dois minutos.sum(increase(milvus_proxy_insert_vectors_count{app_kubernetes_io_instance=~"$instance", app_kubernetes_io_name="$app_name", namespace="$namespace"}[2m])/120) by (pod, node_id)milvus_proxy_insert_vectors_countO número acumulado de vectores inseridos.
Latência de pesquisaA latência média e o percentil 99 da latência de receção de pedidos de pesquisa e consulta por cada proxy nos últimos dois minutos.p99:
histogram_quantile(0.99, sum by (le, query_type, pod, node_id) (rate(milvus_proxy_sq_latency_bucket{app_kubernetes_io_instance=~"$instance", app_kubernetes_io_name="$app_name", namespace="$namespace"}[2m])))
avg:
sum(increase(milvus_proxy_sq_latency_sum{app_kubernetes_io_instance=~"$instance", app_kubernetes_io_name="$app_name", namespace="$namespace"}[2m])) by (pod, node_id, query_type) / sum(increase(milvus_proxy_sq_latency_count{app_kubernetes_io_instance=~"$instance", app_kubernetes_io_name="$app_name", namespace="$namespace"}[2m])) by (pod, node_id, query_type)
milvus_proxy_sq_latencyA latência dos pedidos de pesquisa e consulta.
Latência de pesquisa de colecçõesA latência média e o percentil 99 da latência da receção de pedidos de pesquisa e consulta para uma coleção específica por cada proxy nos últimos dois minutos.p99:
histogram_quantile(0.99, sum by (le, query_type, pod, node_id) (rate(milvus_proxy_collection_sq_latency_bucket{app_kubernetes_io_instance=~"$instance", app_kubernetes_io_name="$app_name", namespace="$namespace", collection_name=~"$collection"}[2m])))
avg:
sum(increase(milvus_proxy_collection_sq_latency_sum{app_kubernetes_io_instance=~"$instance", app_kubernetes_io_name="$app_name", namespace="$namespace", collection_name=~"$collection"}[2m])) by (pod, node_id, query_type) / sum(increase(milvus_proxy_collection_sq_latency_count{app_kubernetes_io_instance=~"$instance", app_kubernetes_io_name="$app_name", namespace="$namespace", collection_name=~"$collection"}[2m])) by (pod, node_id, query_type)
milvus_proxy_collection_sq_latency_sumA latência dos pedidos de pesquisa e consulta para uma coleção específica
Latência de mutaçãoA latência média e o percentil 99 da latência da receção de pedidos de mutação por cada proxy nos últimos dois minutos.p99:
histogram_quantile(0.99, sum by (le, msg_type, pod, node_id) (rate(milvus_proxy_mutation_latency_bucket{app_kubernetes_io_instance=~"$instance", app_kubernetes_io_name="$app_name", namespace="$namespace"}[2m])))
avg:
sum(increase(milvus_proxy_mutation_latency_sum{app_kubernetes_io_instance=~"$instance", app_kubernetes_io_name="$app_name", namespace="$namespace"}[2m])) by (pod, node_id, msg_type) / sum(increase(milvus_proxy_mutation_latency_count{app_kubernetes_io_instance=~"$instance", app_kubernetes_io_name="$app_name", namespace="$namespace"}[2m])) by (pod, node_id, msg_type)
milvus_proxy_mutation_latency_sumA latência dos pedidos de mutação.
Latência de mutação da coleçãoA latência média e o percentil 99 da latência da receção de pedidos de mutação para uma coleção específica por cada proxy nos últimos dois minutos.p99:
histogram_quantile(0.99, sum by (le, query_type, pod, node_id) (rate(milvus_proxy_collection_sq_latency_bucket{app_kubernetes_io_instance=~"$instance", app_kubernetes_io_name="$app_name", namespace="$namespace", collection_name=~"$collection"}[2m])))
avg:
sum(increase(milvus_proxy_collection_sq_latency_sum{app_kubernetes_io_instance=~"$instance", app_kubernetes_io_name="$app_name", namespace="$namespace", collection_name=~"$collection"}[2m])) by (pod, node_id, query_type) / sum(increase(milvus_proxy_collection_sq_latency_count{app_kubernetes_io_instance=~"$instance", app_kubernetes_io_name="$app_name", namespace="$namespace", collection_name=~"$collection"}[2m])) by (pod, node_id, query_type)
milvus_proxy_collection_sq_latency_sumA latência dos pedidos de mutação para uma coleção específica
Latência do resultado da pesquisa de esperaA latência média e o percentil 99 da latência entre o envio de pedidos de pesquisa e consulta e a receção de resultados por proxy nos últimos dois minutos.p99:
histogram_quantile(0.99, sum by (le, query_type, pod, node_id) (rate(milvus_proxy_sq_wait_result_latency_bucket{app_kubernetes_io_instance=~"$instance", app_kubernetes_io_name="$app_name", namespace="$namespace"}[2m])))
avg:
sum(increase(milvus_proxy_sq_wait_result_latency_sum{app_kubernetes_io_instance=~"$instance", app_kubernetes_io_name="$app_name", namespace="$namespace"}[2m])) by (pod, node_id, query_type) / sum(increase(milvus_proxy_sq_wait_result_latency_count{app_kubernetes_io_instance=~"$instance", app_kubernetes_io_name="$app_name", namespace="$namespace"}[2m])) by (pod, node_id, query_type)
milvus_proxy_sq_wait_result_latencyA latência entre o envio de pedidos de pesquisa e consulta e a receção de resultados.
Reduzir a latência dos resultados da pesquisaA latência média e o percentil 99 da latência da agregação de resultados de pesquisa e consulta por proxy nos últimos dois minutos.p99:
histogram_quantile(0.99, sum by (le, query_type, pod, node_id) (rate(milvus_proxy_sq_reduce_result_latency_bucket{app_kubernetes_io_instance=~"$instance", app_kubernetes_io_name="$app_name", namespace="$namespace"}[2m])))
avg:
sum(increase(milvus_proxy_sq_reduce_result_latency_sum{app_kubernetes_io_instance=~"$instance", app_kubernetes_io_name="$app_name", namespace="$namespace"}[2m])) by (pod, node_id, query_type) / sum(increase(milvus_proxy_sq_reduce_result_latency_count{app_kubernetes_io_instance=~"$instance", app_kubernetes_io_name="$app_name", namespace="$namespace"}[2m])) by (pod, node_id, query_type)
milvus_proxy_sq_reduce_result_latencyA latência da agregação dos resultados de pesquisa e consulta retornados por cada nó de consulta.
Latência de descodificação dos resultados da pesquisaA latência média e o percentil 99 da latência da descodificação de resultados de pesquisa e consulta por proxy nos últimos dois minutos.p99:
histogram_quantile(0.99, sum by (le, query_type, pod, node_id) (rate(milvus_proxy_sq_decode_result_latency_bucket{app_kubernetes_io_instance=~"$instance", app_kubernetes_io_name="$app_name", namespace="$namespace"}[2m])))
avg:
sum(increase(milvus_proxy_sq_decode_result_latency_sum{app_kubernetes_io_instance=~"$instance", app_kubernetes_io_name="$app_name", namespace="$namespace"}[2m])) by (pod, node_id, query_type) / sum(increase(milvus_proxy_sq_decode_resultlatency_count{app_kubernetes_io_instance=~"$instance", app_kubernetes_io_name="$app_name", namespace="$namespace"}[2m])) by (pod, node_id, query_type)
milvus_proxy_sq_decode_result_latencyA latência da descodificação de cada resultado de pesquisa e consulta.
Número de objectos de fluxo de mensagensO número médio, máximo e mínimo dos objectos msgstream criados por cada proxy no tópico físico correspondente nos últimos dois minutos.avg(milvus_proxy_msgstream_obj_num{app_kubernetes_io_instance=~"$instance", app_kubernetes_io_name="$app_name", namespace="$namespace"}) by (pod, node_id) max(milvus_proxy_msgstream_obj_num{app_kubernetes_io_instance=~"$instance", app_kubernetes_io_name="$app_name", namespace="$namespace"}) by (pod, node_id) min(milvus_proxy_msgstream_obj_num{app_kubernetes_io_instance=~"$instance", app_kubernetes_io_name="$app_name", namespace="$namespace"}) by (pod, node_id)milvus_proxy_msgstream_obj_numO número de objetos msgstream criados em cada tópico físico.
Latência de envio de mutaçãoA latência média e o percentil 99 da latência do envio de solicitações de inserção ou exclusão por cada proxy nos últimos dois minutos.p99:
histogram_quantile(0.99, sum by (le, msg_type, pod, node_id) (rate(milvus_proxy_mutation_send_latency_bucket{app_kubernetes_io_instance=~"$instance", app_kubernetes_io_name="$app_name", namespace="$namespace"}[2m])))
avg:
sum(increase(milvus_proxy_mutation_send_latency_sum{app_kubernetes_io_instance=~"$instance", app_kubernetes_io_name="$app_name", namespace="$namespace"}[2m])) by (pod, node_id, msg_type) / sum(increase(milvus_proxy_mutation_send_latency_count{app_kubernetes_io_instance=~"$instance", app_kubernetes_io_name="$app_name", namespace="$namespace"}[2m])) by (pod, node_id, msg_type)
milvus_proxy_mutation_send_latencyA latência do envio de solicitações de inserção ou exclusão.
Taxa de acerto da cacheA taxa média de acerto da cache de operações incluindo GeCollectionID, GetCollectionInfo e GetCollectionSchema por segundo nos últimos dois minutos.sum(increase(milvus_proxy_cache_hit_count{app_kubernetes_io_instance=~"$instance", app_kubernetes_io_name="$app_name", namespace="$namespace", cache_state="hit"}[2m])/120) by(cache_name, pod, node_id) / sum(increase(milvus_proxy_cache_hit_count{app_kubernetes_io_instance=~"$instance", app_kubernetes_io_name="$app_name", namespace="$namespace"}[2m])/120) by(cache_name, pod, node_id)milvus_proxy_cache_hit_countAs estatísticas da taxa de acerto e falha de cada operação de leitura da cache.
Latência de atualização da cacheA latência média e o percentil 99 da latência de atualização da cache por proxy nos últimos dois minutos.p99:
histogram_quantile(0.99, sum by (le, pod, node_id) (rate(milvus_proxy_cache_update_latency_bucket{app_kubernetes_io_instance=~"$instance", app_kubernetes_io_name="$app_name", namespace="$namespace"}[2m])))
avg:
sum(increase(milvus_proxy_cache_update_latency_sum{app_kubernetes_io_instance=~"$instance", app_kubernetes_io_name="$app_name", namespace="$namespace"}[2m])) by (pod, node_id) / sum(increase(milvus_proxy_cache_update_latency_count{app_kubernetes_io_instance=~"$instance", app_kubernetes_io_name="$app_name", namespace="$namespace"}[2m])) by (pod, node_id)
milvus_proxy_cache_update_latencyA latência da atualização da cache de cada vez.
Tempo de sincronizaçãoO número médio, máximo e mínimo de tempo de época sincronizado por cada proxy em seu canal físico correspondente.avg(milvus_proxy_sync_epoch_time{app_kubernetes_io_instance=~"$instance", app_kubernetes_io_name="$app_name", namespace="$namespace"}) by (pod, node_id) max(milvus_proxy_sync_epoch_time{app_kubernetes_io_instance=~"$instance", app_kubernetes_io_name="$app_name", namespace="$namespace"}) by (pod, node_id) min(milvus_proxy_sync_epoch_time{app_kubernetes_io_instance=~"$instance", app_kubernetes_io_name="$app_name", namespace="$namespace"}) by (pod, node_id)milvus_proxy_sync_epoch_timeA hora de época de cada canal físico (hora Unix, os milissegundos passados desde 1 de janeiro de 1970).
Existe uma predefinição ChannelName para além dos canais físicos.
Aplicar latência PKA latência média e o percentil 99 da latência da aplicação da chave primária por cada proxy nos últimos dois minutos.p99:
histogram_quantile(0.99, sum by (le, pod, node_id) (rate(milvus_proxy_apply_pk_latency_bucket{app_kubernetes_io_instance=~"$instance", app_kubernetes_io_name="$app_name", namespace="$namespace"}[2m])))
avg:
sum(increase(milvus_proxy_apply_pk_latency_sum{app_kubernetes_io_instance=~"$instance", app_kubernetes_io_name="$app_name", namespace="$namespace"}[2m])) by (pod, node_id) / sum(increase(milvus_proxy_apply_pk_latency_count{app_kubernetes_io_instance=~"$instance", app_kubernetes_io_name="$app_name", namespace="$namespace"}[2m])) by (pod, node_id)
milvus_proxy_apply_pk_latencyA latência da aplicação da chave primária.
Latência de aplicação de carimbo de data/horaA latência média e o percentil 99 da latência da aplicação do carimbo de data/hora por cada proxy nos últimos dois minutos.p99:
histogram_quantile(0.99, sum by (le, pod, node_id) (rate(milvus_proxy_apply_timestamp_latency_bucket{app_kubernetes_io_instance=~"$instance", app_kubernetes_io_name="$app_name", namespace="$namespace"}[2m])))
avg:
sum(increase(milvus_proxy_apply_timestamp_latency_sum{app_kubernetes_io_instance=~"$instance", app_kubernetes_io_name="$app_name", namespace="$namespace"}[2m])) by (pod, node_id) / sum(increase(milvus_proxy_apply_timestamp_latency_count{app_kubernetes_io_instance=~"$instance", app_kubernetes_io_name="$app_name", namespace="$namespace"}[2m])) by (pod, node_id)
milvus_proxy_apply_timestamp_latencyA latência da aplicação do carimbo de data/hora.
Taxa de sucesso do pedidoO número de solicitações bem-sucedidas recebidas por segundo por cada proxy, com uma análise detalhada de cada tipo de solicitação. Os tipos de pedido possíveis são DescribeCollection, DescribeIndex, GetCollectionStatistics, HasCollection, Search, Query, ShowPartitions, Insert, etc.
sum(increase(milvus_proxy_req_count{app_kubernetes_io_instance=~"$instance", app_kubernetes_io_name="$app_name", namespace="$namespace", status="success"}[2m])/120) by(function_name, pod, node_id)milvus_proxy_req_countO número de todos os tipos de pedidos recebidos
Taxa de pedidos falhadosO número de pedidos falhados recebidos por segundo por cada proxy, com uma análise detalhada de cada tipo de pedido. Os tipos de pedido possíveis são DescribeCollection, DescribeIndex, GetCollectionStatistics, HasCollection, Search, Query, ShowPartitions, Insert, etc.
sum(increase(milvus_proxy_req_count{app_kubernetes_io_instance=~"$instance", app_kubernetes_io_name="$app_name", namespace="$namespace", status="fail"}[2m])/120) by(function_name, pod, node_id)milvus_proxy_req_countO número de todos os tipos de pedidos recebidos
Latência do pedidoA latência média e o percentil 99 da latência de todos os tipos de pedidos recebidos por cada proxyp99:
histogram_quantile(0.99, sum by (le, pod, node_id, function_name) (rate(milvus_proxy_req_latency_bucket{app_kubernetes_io_instance=~"$instance", app_kubernetes_io_name="$app_name", namespace="$namespace"}[2m])))
avg:
sum(increase(milvus_proxy_req_latency_sum{app_kubernetes_io_instance=~"$instance", app_kubernetes_io_name="$app_name", namespace="$namespace"}[2m])) by (pod, node_id, function_name) / sum(increase(milvus_proxy_req_latency_count{app_kubernetes_io_instance=~"$instance", app_kubernetes_io_name="$app_name", namespace="$namespace"}[2m])) by (pod, node_id, function_name)
milvus_proxy_req_latencyA latência de todos os tipos de pedidos de receção
Taxa de bytes de pedidos de inserção/eliminaçãoO número de bytes de pedidos de inserção e exclusão recebidos por segundo pelo proxy nos últimos dois minutos.sum(increase(milvus_proxy_receive_bytes_count{app_kubernetes_io_instance=~"$instance", app_kubernetes_io_name="$app_name", namespace="$namespace"}[2m])/120) by(pod, node_id)milvus_proxy_receive_bytes_countA contagem de pedidos de inserção e exclusão.
Taxa de envio de bytesO número de bytes por segundo enviados de volta para o cliente enquanto cada proxy está a responder a pedidos de pesquisa e consulta nos últimos dois minutos.sum(increase(milvus_proxy_send_bytes_count{app_kubernetes_io_instance=~"$instance", app_kubernetes_io_name="$app_name", namespace="$namespace"}[2m])/120) by(pod, node_id)milvus_proxy_send_bytes_countO número de bytes enviados de volta ao cliente enquanto cada proxy está a responder a pedidos de pesquisa e consulta.

Coordenador raiz

PainelDescrição do painelPromQL (linguagem de consulta do Prometheus)As métricas Milvus utilizadasDescrição das métricas do Milvus
Número do nó de proxyO número de proxies criados.sum(milvus_rootcoord_proxy_num{app_kubernetes_io_instance=~"$instance", app_kubernetes_io_name="$app_name", namespace="$namespace"}) by (app_kubernetes_io_instance)milvus_rootcoord_proxy_numO número de proxies.
Tempo de sincronizaçãoO número médio, máximo e mínimo de tempo de época sincronizado por cada coordenada raiz em cada canal físico (PChannel).avg(milvus_rootcoord_sync_epoch_time{app_kubernetes_io_instance=~"$instance", app_kubernetes_io_name="$app_name", namespace="$namespace"}) by (app_kubernetes_io_instance) max(milvus_rootcoord_sync_epoch_time{app_kubernetes_io_instance=~"$instance", app_kubernetes_io_name="$app_name", namespace="$namespace"}) by (app_kubernetes_io_instance) min(milvus_rootcoord_sync_epoch_time{app_kubernetes_io_instance=~"$instance", app_kubernetes_io_name="$app_name", namespace="$namespace"}) by (app_kubernetes_io_instance)milvus_rootcoord_sync_epoch_timeA hora de época de cada canal físico (hora Unix, os milissegundos passados desde 1 de janeiro de 1970).
Taxa de solicitação DDLO status e o número de solicitações DDL por segundo nos últimos dois minutos.sum(increase(milvus_rootcoord_ddl_req_count{app_kubernetes_io_instance=~"$instance", app_kubernetes_io_name="$app_name", namespace="$namespace"}[2m])/120) by (status, function_name)milvus_rootcoord_ddl_req_countO número total de solicitações DDL, incluindo CreateCollection, DescribeCollection, DescribeSegments, HasCollection, ShowCollections, ShowPartitions, e ShowSegments.
Latência do pedido DDLA latência média e o percentil 99 da latência do pedido DDL nos últimos dois minutos.p99:
histogram_quantile(0.99, sum by (le, function_name) (rate(milvus_rootcoord_ddl_req_latency_bucket{app_kubernetes_io_instance=~"$instance", app_kubernetes_io_name="$app_name", namespace="$namespace"}[2m])))
avg:
sum(increase(milvus_rootcoord_ddl_req_latency_sum{app_kubernetes_io_instance=~"$instance", app_kubernetes_io_name="$app_name", namespace="$namespace"}[2m])) by (function_name) / sum(increase(milvus_rootcoord_ddl_req_latency_count{app_kubernetes_io_instance=~"$instance", app_kubernetes_io_name="$app_name", namespace="$namespace"}[2m])) by (function_name)
milvus_rootcoord_ddl_req_latencyA latência de todos os tipos de solicitações DDL.
Latência de sincronização TimetickA latência média e o percentil 99 do tempo usado pela coordenada raiz para sincronizar todos os carimbos de data/hora com o PChannel nos últimos dois minutos.p99:
histogram_quantile(0.99, sum by (le) (rate(milvus_rootcoord_sync_timetick_latency_bucket{app_kubernetes_io_instance=~"$instance", app_kubernetes_io_name="$app_name", namespace="$namespace"}[2m])))
avg:
sum(increase(milvus_rootcoord_sync_timetick_latency_sum{app_kubernetes_io_instance=~"$instance", app_kubernetes_io_name="$app_name", namespace="$namespace"}[2m])) / sum(increase(milvus_rootcoord_sync_timetick_latency_count{app_kubernetes_io_instance=~"$instance", app_kubernetes_io_name="$app_name", namespace="$namespace"}[2m]))
milvus_rootcoord_sync_timetick_latencyo tempo usado pelo coordenador raiz para sincronizar todos os carimbos de data/hora com o pchannel.
Taxa de atribuição de IDO número de IDs atribuídos pela coordenada raiz por segundo nos últimos dois minutos.sum(increase(milvus_rootcoord_id_alloc_count{app_kubernetes_io_instance=~"$instance", app_kubernetes_io_name="$app_name", namespace="$namespace"}[2m])/120)milvus_rootcoord_id_alloc_countO número acumulado de IDs atribuídos pela coord raiz.
Carimbo de TempoO carimbo de data/hora mais recente da coordenada raiz.milvus_rootcoord_timestamp{app_kubernetes_io_instance=~"$instance", app_kubernetes_io_name="$app_name", namespace="$namespace"}milvus_rootcoord_timestampO carimbo de data/hora mais recente da coordenada raiz.
Carimbo de data/hora guardadoOs carimbos de data/hora pré-atribuídos que a coord. raiz guarda no meta-armazenamento.milvus_rootcoord_timestamp_saved{app_kubernetes_io_instance=~"$instance", app_kubernetes_io_name="$app_name", namespace="$namespace"}milvus_rootcoord_timestamp_savedOs carimbos de data/hora pré-atribuídos que a coordenada de raiz guarda no meta armazenamento.
Os carimbos de data/hora são atribuídos 3 segundos antes. E o carimbo de data/hora é atualizado e guardado no meta storage a cada 50 milissegundos.
Número da coleçãoO número total de colecções.sum(milvus_rootcoord_collection_num{app_kubernetes_io_instance=~"$instance", app_kubernetes_io_name="$app_name", namespace="$namespace"}) by (app_kubernetes_io_instance)milvus_rootcoord_collection_numO número total de colecções existentes no Milvus atualmente.
Número da partiçãoO número total de partições.sum(milvus_rootcoord_partition_num{app_kubernetes_io_instance=~"$instance", app_kubernetes_io_name="$app_name", namespace="$namespace"}) by (app_kubernetes_io_instance)milvus_rootcoord_partition_numO número total de partições existentes no Milvus atualmente.
Número do canal DMLO número total de canais DML.sum(milvus_rootcoord_dml_channel_num{app_kubernetes_io_instance=~"$instance", app_kubernetes_io_name="$app_name", namespace="$namespace"}) by (app_kubernetes_io_instance)milvus_rootcoord_dml_channel_numO número total de canais DML existentes no Milvus atualmente.
Msgstream NumO número total de msgstreams.sum(milvus_rootcoord_msgstream_obj_num{app_kubernetes_io_instance=~"$instance", app_kubernetes_io_name="$app_name", namespace="$namespace"}) by (app_kubernetes_io_instance)milvus_rootcoord_msgstream_obj_numO número total de msgstreams existentes atualmente no Milvus.
Número de credenciaisO número total de credenciais.sum(milvus_rootcoord_credential_num{app_kubernetes_io_instance=~"$instance", app_kubernetes_io_name="$app_name", namespace="$namespace"}) by (app_kubernetes_io_instance)milvus_rootcoord_credential_numO número total de credenciais existentes atualmente no Milvus.
Tempo de atraso do tique-taqueA soma do tempo máximo de atraso dos gráficos de fluxo em todos os DataNodes e QueryNodes.sum(milvus_rootcoord_time_tick_delay{app_kubernetes_io_instance=~"$instance", app_kubernetes_io_name="$app_name", namespace="$namespace"}) by (app_kubernetes_io_instance)milvus_rootcoord_time_tick_delayO tempo máximo de atraso dos gráficos de fluxo em cada DataNode e QueryNode.

Coordenador de consultas

PainelDescrição do painelPromQL (linguagem de consulta do Prometheus)As métricas Milvus utilizadasDescrição das métricas Milvus
Número de colecções carregadasO número de colecções que estão atualmente carregadas na memória.sum(milvus_querycoord_collection_num{app_kubernetes_io_instance=~"$instance", app_kubernetes_io_name="$app_name", namespace="$namespace"}) by (app_kubernetes_io_instance)milvus_querycoord_collection_numO número de colecções que estão atualmente carregadas pelo Milvus.
Entidade carregadaO número de entidades que estão atualmente carregadas na memória.sum(milvus_querycoord_entity_num{app_kubernetes_io_instance=~"$instance", app_kubernetes_io_name="$app_name", namespace="$namespace"}) by (app_kubernetes_io_instance)milvus_querycoord_entitiy_numO número de entidades que estão atualmente carregadas pelo Milvus.
Taxa de pedidos de carregamentoO número de pedidos de carregamento por segundo nos últimos dois minutos.sum(increase(milvus_querycoord_load_req_count{app_kubernetes_io_instance=~"$instance", app_kubernetes_io_name="$app_name", namespace="$namespace"}[2m])120) by (status)milvus_querycoord_load_req_countO número acumulado de solicitações de carga.
Taxa de solicitação de liberaçãoO número de solicitações de liberação por segundo nos últimos dois minutos.sum(increase(milvus_querycoord_release_req_count{app_kubernetes_io_instance=~"$instance", app_kubernetes_io_name="$app_name", namespace="$namespace"}[2m])/120) by (status)milvus_querycoord_release_req_countO número acumulado de solicitações de liberação.
Latência de solicitação de cargaA latência média e o 99º percentil da latência da solicitação de carga nos últimos dois minutos.p99:
histogram_quantile(0.99, sum by (le) (rate(milvus_querycoord_load_latency_bucket{app_kubernetes_io_instance=~"$instance", app_kubernetes_io_name="$app_name", namespace="$namespace"}[2m])))
avg:
sum(increase(milvus_querycoord_load_latency_sum{app_kubernetes_io_instance=~"$instance", app_kubernetes_io_name="$app_name", namespace="$namespace"}[2m])) / sum(increase(milvus_querycoord_load_latency_count{app_kubernetes_io_instance=~"$instance", app_kubernetes_io_name="$app_name", namespace="$namespace"}[2m]))
milvus_querycoord_load_latencyO tempo usado para concluir uma solicitação de carga.
Latência da solicitação de liberaçãoA latência média e o percentil 99 da latência da solicitação de liberação nos últimos dois minutos.p99:
histogram_quantile(0.99, sum by (le) (rate(milvus_querycoord_release_latency_bucket{app_kubernetes_io_instance=~"$instance", app_kubernetes_io_name="$app_name", namespace="$namespace"}[2m])))
avg:
sum(increase(milvus_querycoord_release_latency_sum{app_kubernetes_io_instance=~"$instance", app_kubernetes_io_name="$app_name", namespace="$namespace"}[2m])) / sum(increase(milvus_querycoord_release_latency_count{app_kubernetes_io_instance=~"$instance", app_kubernetes_io_name="$app_name", namespace="$namespace"}[2m]))
milvus_querycoord_release_latencyO tempo usado para concluir uma solicitação de liberação.
Tarefa de subcargaO número de tarefas de subcarga.sum(milvus_querycoord_child_task_num{app_kubernetes_io_instance=~"$instance", app_kubernetes_io_name="$app_name", namespace="$namespace"}) by (app_kubernetes_io_instance)milvus_querycoord_child_task_numO número de tarefas de subcarga.
Uma coordenada de consulta divide um pedido de carga em várias subtarefas de carga.
Tarefa de carga paiO número de tarefas de carga pai.sum(milvus_querycoord_parent_task_num{app_kubernetes_io_instance=~"$instance", app_kubernetes_io_name="$app_name", namespace="$namespace"}) by (app_kubernetes_io_instance)milvus_querycoord_parent_task_numO número de subtarefas de carga.
Cada pedido de carga corresponde a uma tarefa principal na fila de tarefas.
Latência da tarefa de subcargaA latência média e o 99º percentil da latência de uma tarefa de subcarga nos últimos dois minutos.p99:
histogram_quantile(0.99, sum by (le) (rate(milvus_querycoord_child_task_latency_bucket{app_kubernetes_io_instance=~"$instance", app_kubernetes_io_name="$app_name", namespace="$namespace"}[2m])))
avg:
sum(increase(milvus_querycoord_child_task_latency_sum{app_kubernetes_io_instance=~"$instance", app_kubernetes_io_name="$app_name", namespace="$namespace"}[2m])) / sum(increase(milvus_querycoord_child_task_latency_count{app_kubernetes_io_instance=~"$instance", app_kubernetes_io_name="$app_name", namespace="$namespace"}[2m])) namespace"}[2m])))
milvus_querycoord_child_task_latencyA latência para concluir uma tarefa de subcarga.
Número do nó de consultaO número de nós de consulta geridos pela coordenação de consulta.sum(milvus_querycoord_querynode_num{app_kubernetes_io_instance=~"$instance", app_kubernetes_io_name="$app_name", namespace="$namespace"}) by (app_kubernetes_io_instance)milvus_querycoord_querynode_numO número de nós de consulta geridos pelo coordenador de consultas.

Nó de consulta

PainelDescrição do painelPromQL (linguagem de consulta Prometheus)As métricas Milvus utilizadasDescrição das métricas do Milvus
Número de colecções carregadasO número de colecções carregadas na memória por cada nó de consulta.sum(milvus_querynode_collection_num{app_kubernetes_io_instance=~"$instance", app_kubernetes_io_name="$app_name", namespace="$namespace"}) by (pod, node_id)milvus_querynode_collection_numO número de colecções carregadas por cada nó de consulta.
Número de partições carregadasO número de partições carregadas para a memória por cada nó de consulta.sum(milvus_querynode_partition_num{app_kubernetes_io_instance=~"$instance", app_kubernetes_io_name="$app_name", namespace="$namespace"}) by (pod, node_id)milvus_querynode_partition_numO número de partições carregadas por cada nó de consulta.
Número de segmentos carregadosO número de segmentos carregados na memória por cada nó de consulta.sum(milvus_querynode_segment_num{app_kubernetes_io_instance=~"$instance", app_kubernetes_io_name="$app_name", namespace="$namespace"}) by (pod, node_id)milvus_querynode_segment_numO número de segmentos carregados por cada nó de consulta.
Número de entidades consultáveisO número de entidades consultáveis e pesquisáveis em cada nó de consulta.sum(milvus_querynode_entity_num{app_kubernetes_io_instance=~"$instance", app_kubernetes_io_name="$app_name", namespace="$namespace"}) by (pod, node_id)milvus_querynode_entity_numO número de entidades consultáveis e pesquisáveis em cada nó de consulta.
Canal virtual DMLO número de canais virtuais DML observados por cada nó de consulta.sum(milvus_querynode_dml_vchannel_num{app_kubernetes_io_instance=~"$instance", app_kubernetes_io_name="$app_name", namespace="$namespace"}) by (pod, node_id)milvus_querynode_dml_vchannel_numO número de canais virtuais DML observados por cada nó de consulta.
Canal virtual deltaO número de canais delta observados por cada nó de consulta.sum(milvus_querynode_delta_vchannel_num{app_kubernetes_io_instance=~"$instance", app_kubernetes_io_name="$app_name", namespace="$namespace"}) by (pod, node_id)milvus_querynode_delta_vchannel_numO número de canais delta observados por cada nó de consulta.
Número de consumidoresO número de consumidores em cada nó de consulta.sum(milvus_querynode_consumer_num{app_kubernetes_io_instance=~"$instance", app_kubernetes_io_name="$app_name", namespace="$namespace"}) by (pod, node_id)milvus_querynode_consumer_numO número de consumidores em cada nó de consulta.
Taxa de pedidos de pesquisaO número total de pedidos de pesquisa e de consulta recebidos por segundo por cada nó de consulta e o número de pedidos de pesquisa e de consulta bem sucedidos nos últimos dois minutos.sum(increase(milvus_querynode_sq_req_count{app_kubernetes_io_instance=~"$instance", app_kubernetes_io_name="$app_name", namespace="$namespace"}[2m])/120) by (query_type, status, pod, node_id)milvus_querynode_sq_req_countO número acumulado de pedidos de pesquisa e consulta.
Latência dos pedidos de pesquisaA latência média e o percentil 99 do tempo utilizado nos pedidos de pesquisa e consulta por cada nó de consulta nos últimos dois minutos.
Este painel apresenta a latência dos pedidos de pesquisa e consulta cujo estado é "sucesso" ou "total".
p99:
histogram_quantile(0.99, sum by (le, pod, node_id) (rate(milvus_querynode_sq_req_latency_bucket{app_kubernetes_io_instance=~"$instance", app_kubernetes_io_name="$app_name", namespace="$namespace"}[2m])))
avg:
sum(increase(milvus_querynode_sq_req_latency_sum{app_kubernetes_io_instance=~"$instance", app_kubernetes_io_name="$app_name", namespace="$namespace"}[2m])) by(pod, node_id, query_type) / sum(increase(milvus_querynode_sq_req_latency_count{app_kubernetes_io_instance=~"$instance", app_kubernetes_io_name="$app_name", namespace="$namespace"}[2m])) by(pod, node_id, query_type)
milvus_querynode_sq_req_latencyA latência do pedido de pesquisa do nó de consulta.
Latência de pesquisa em filaA latência média e o percentil 99 da latência dos pedidos de pesquisa e consulta em fila nos últimos dois minutos.p99:
histogram_quantile(0.99, sum by (le, pod, node_id, query_type) (rate(milvus_querynode_sq_queue_latency_bucket{app_kubernetes_io_instance=~"$instance", app_kubernetes_io_name="$app_name", namespace="$namespace"}[2m])))
avg:
sum(increase(milvus_querynode_sq_queue_latency_sum{app_kubernetes_io_instance=~"$instance", app_kubernetes_io_name="$app_name", namespace="$namespace"}[2m])) by(pod, node_id, query_type) / sum(increase(milvus_querynode_sq_queue_latency_count{app_kubernetes_io_instance=~"$instance", app_kubernetes_io_name="$app_name", namespace="$namespace"}[2m])) by(pod, node_id, query_type)
milvus_querynode_sq_queue_latencyA latência dos pedidos de pesquisa e consulta recebidos pelo nó de consulta.
Latência do segmento de pesquisaA latência média e o percentil 99 do tempo que cada nó de consulta leva para pesquisar e consultar um segmento nos últimos dois minutos.
O estado de um segmento pode ser selado ou crescente.
p99:
histogram_quantile(0.99, sum by (le, query_type, segment_state, pod, node_id) (rate(milvus_querynode_sq_segment_latency_bucket{app_kubernetes_io_instance=~"$instance", app_kubernetes_io_name="$app_name", namespace="$namespace"}[2m])))
avg:
sum(increase(milvus_querynode_sq_segment_latency_sum{app_kubernetes_io_instance=~"$instance", app_kubernetes_io_name="$app_name", namespace="$namespace"}[2m])) by(pod, node_id, query_type, segment_state) / sum(increase(milvus_querynode_sq_segment_latency_count{app_kubernetes_io_instance=~"$instance", app_kubernetes_io_name="$app_name", namespace="$namespace"}[2m])) by(pod, node_id, query_type, segment_state)
milvus_querynode_sq_segment_latencyO tempo que cada nó de consulta leva para pesquisar e consultar cada segmento.
Latência de solicitação do SegcoreA latência média e o percentil 99 do tempo que cada nó de consulta leva para pesquisar e consultar no segcore nos últimos dois minutos.p99:
histogram_quantile(0.99, sum by (le, query_type, pod, node_id) (rate(milvus_querynode_sq_core_latency_bucket{app_kubernetes_io_instance=~"$instance", app_kubernetes_io_name="$app_name", namespace="$namespace"}[2m])))
avg:
sum(increase(milvus_querynode_sq_core_latency_sum{app_kubernetes_io_instance=~"$instance", app_kubernetes_io_name="$app_name", namespace="$namespace"}[2m])) by(pod, node_id, query_type) / sum(increase(milvus_querynode_sq_core_latency_count{app_kubernetes_io_instance=~"$instance", app_kubernetes_io_name="$app_name", namespace="$namespace"}[2m])) by(pod, node_id, query_type)
milvus_querynode_sq_core_latencyO tempo que cada nó de consulta leva para pesquisar e consultar no segcore.
Latência de redução de pesquisaA latência média e o 99º percentil do tempo usado por cada nó de consulta durante o estágio de redução de uma pesquisa ou consulta nos últimos dois minutos.p99:
histogram_quantile(0.99, sum by (le, pod, node_id, query_type) (rate(milvus_querynode_sq_reduce_latency_bucket{app_kubernetes_io_instance=~"$instance", app_kubernetes_io_name="$app_name", namespace="$namespace"}[2m])))
avg:
sum(increase(milvus_querynode_sq_reduce_latency_sum{app_kubernetes_io_instance=~"$instance", app_kubernetes_io_name="$app_name", namespace="$namespace"}[2m])) by(pod, node_id, query_type) / sum(increase(milvus_querynode_sq_reduce_latency_count{app_kubernetes_io_instance=~"$instance", app_kubernetes_io_name="$app_name", namespace="$namespace"}[2m])) by(pod, node_id, query_type)
milvus_querynode_sq_reduce_latencyO tempo que cada consulta gasta durante o estágio de redução.
Latência do segmento de cargaA latência média e o percentil 99 do tempo que cada nó de consulta leva para carregar um segmento nos últimos dois minutos.p99:
histogram_quantile(0.99, sum by (le, pod, node_id) (rate(milvus_querynode_load_segment_latency_bucket{app_kubernetes_io_instance=~"$instance", app_kubernetes_io_name="$app_name", namespace="$namespace"}[2m])))
avg:
sum(increase(milvus_querynode_load_segment_latency_sum{app_kubernetes_io_instance=~"$instance", app_kubernetes_io_name="$app_name", namespace="$namespace"}[2m])) by(pod, node_id) / sum(increase(milvus_querynode_load_segment_latency_count{app_kubernetes_io_instance=~"$instance", app_kubernetes_io_name="$app_name", namespace="$namespace"}[2m])) by(pod, node_id)
milvus_querynode_load_segment_latency_bucketO tempo que cada nó de consulta leva para carregar um segmento.
Número do fluxogramaO número de fluxogramas em cada nó de consulta.sum(milvus_querynode_flowgraph_num{app_kubernetes_io_instance=~"$instance", app_kubernetes_io_name="$app_name", namespace="$namespace"}) by (pod, node_id)milvus_querynode_flowgraph_numO número de fluxogramas em cada nó de consulta.
Comprimento da tarefa de leitura não resolvidaO comprimento da fila de pedidos de leitura não resolvidos em cada nó de consulta.sum(milvus_querynode_read_task_unsolved_len{app_kubernetes_io_instance=~"$instance", app_kubernetes_io_name="$app_name", namespace="$namespace"}) by (pod, node_id)milvus_querynode_read_task_unsolved_lenO comprimento da fila de pedidos de leitura não resolvidos.
Comprimento da tarefa de leitura prontaO comprimento da fila de pedidos de leitura a serem executados em cada nó de consulta.sum(milvus_querynode_read_task_ready_len{app_kubernetes_io_instance=~"$instance", app_kubernetes_io_name="$app_name", namespace="$namespace"}) by (pod, node_id)milvus_querynode_read_task_ready_lenO comprimento da fila de pedidos de leitura a serem executados.
Número da tarefa de leitura paralelaO número de pedidos de leitura simultâneos executados atualmente em cada nó de consulta.sum(milvus_querynode_read_task_concurrency{app_kubernetes_io_instance=~"$instance", app_kubernetes_io_name="$app_name", namespace="$namespace"}) by (pod, node_id)milvus_querynode_read_task_concurrencyO número de solicitações de leitura simultâneas executadas atualmente.
Estimativa de uso da CPUA utilização da CPU por cada nó de consulta estimada pelo agendador.sum(milvus_querynode_estimate_cpu_usage{app_kubernetes_io_instance=~"$instance", app_kubernetes_io_name="$app_name", namespace="$namespace"}) by (pod, node_id)milvus_querynode_estimate_cpu_usageA utilização da CPU por cada nó de consulta estimada pelo agendador.
Quando o valor é 100, isso significa que uma CPU virtual inteira (vCPU) é usada.
Tamanho do grupo de pesquisaO número médio e o percentil 99 do tamanho do grupo de pesquisa (ou seja, o número total de pedidos de pesquisa originais nos pedidos de pesquisa combinados executados por cada nó de consulta) nos últimos dois minutos.p99:
histogram_quantile(0.99, sum by (le, pod, node_id) (rate(milvus_querynode_search_group_size_bucket{app_kubernetes_io_instance=~"$instance", app_kubernetes_io_name="$app_name", namespace="$namespace"}[2m])))
avg:
sum(increase(milvus_querynode_search_group_size_sum{app_kubernetes_io_instance=~"$instance", app_kubernetes_io_name="$app_name", namespace="$namespace"}[2m])) by(pod, node_id) / sum(increase(milvus_querynode_search_group_size_count{app_kubernetes_io_instance=~"$instance", app_kubernetes_io_name="$app_name", namespace="$namespace"}[2m])) by(pod, node_id)
milvus_querynode_load_segment_latency_bucketO número de tarefas de pesquisa originais entre as tarefas de pesquisa combinadas de diferentes compartimentos (ou seja, o tamanho do grupo de pesquisa).
Pesquisa NQO número médio e o percentil 99 do número de consultas (NQ) efectuadas enquanto cada nó de consulta executa pedidos de pesquisa nos últimos dois minutos.p99:
histogram_quantile(0.99, sum by (le, pod, node_id) (rate(milvus_querynode_search_group_size_bucket{app_kubernetes_io_instance=~"$instance", app_kubernetes_io_name="$app_name", namespace="$namespace"}[2m])))
avg:
sum(increase(milvus_querynode_search_group_size_sum{app_kubernetes_io_instance=~"$instance", app_kubernetes_io_name="$app_name", namespace="$namespace"}[2m])) by(pod, node_id) / sum(increase(milvus_querynode_search_group_size_count{app_kubernetes_io_instance=~"$instance", app_kubernetes_io_name="$app_name", namespace="$namespace"}[2m])) by(pod, node_id)
milvus_querynode_load_segment_latency_bucketO número de consultas (NQ) dos pedidos de pesquisa.
Grupo de pesquisa NQO número médio e o percentil 99 do NQ de pedidos de pesquisa combinados e executados por cada nó de consulta nos últimos dois minutos.p99:
histogram_quantile(0.99, sum by (le, pod, node_id) (rate(milvus_querynode_search_group_nq_bucket{app_kubernetes_io_instance=~"$instance", app_kubernetes_io_name="$app_name", namespace="$namespace"}[2m])))
avg:
sum(increase(milvus_querynode_search_group_nq_sum{app_kubernetes_io_instance=~"$instance", app_kubernetes_io_name="$app_name", namespace="$namespace"}[2m])) by(pod, node_id) / sum(increase(milvus_querynode_search_group_nq_count{app_kubernetes_io_instance=~"$instance", app_kubernetes_io_name="$app_name", namespace="$namespace"}[2m])) by(pod, node_id)
milvus_querynode_load_segment_latency_bucketO NQ de solicitações de pesquisa combinadas de diferentes compartimentos.
Pesquisa Top_KO número médio e o percentil 99 do Top_K de pedidos de pesquisa executados por cada nó de consulta nos últimos dois minutos.p99:
histogram_quantile(0.99, sum by (le, pod, node_id) (rate(milvus_querynode_search_topk_bucket{app_kubernetes_io_instance=~"$instance", app_kubernetes_io_name="$app_name", namespace="$namespace"}[2m])))
avg:
sum(increase(milvus_querynode_search_topk_sum{app_kubernetes_io_instance=~"$instance", app_kubernetes_io_name="$app_name", namespace="$namespace"}[2m])) by(pod, node_id) / sum(increase(milvus_querynode_search_topk_count{app_kubernetes_io_instance=~"$instance", app_kubernetes_io_name="$app_name", namespace="$namespace"}[2m])) by(pod, node_id)
milvus_querynode_load_segment_latency_bucketO Top_K de pedidos de pesquisa.
Grupo de pesquisa Top_KO número médio e o percentil 99 do Top_K de pedidos de pesquisa combinados e executados por cada nó de consulta nos últimos dois minutos.p99:
histogram_quantile(0.99, sum by (le, pod, node_id) (rate(milvus_querynode_search_group_topk_bucket{app_kubernetes_io_instance=~"$instance", app_kubernetes_io_name="$app_name", namespace="$namespace"}[2m])))
avg:
sum(increase(milvus_querynode_search_group_topk_sum{app_kubernetes_io_instance=~"$instance", app_kubernetes_io_name="$app_name", namespace="$namespace"}[2m])) by(pod, node_id) / sum(increase(milvus_querynode_search_group_topk_count{app_kubernetes_io_instance=~"$instance", app_kubernetes_io_name="$app_name", namespace="$namespace"}[2m])) by(pod, node_id)
milvus_querynode_load_segment_latency_bucketO Top_K de solicitações de pesquisa combinadas de diferentes compartimentos.
Taxa de pedidos de leitura evitadosO número de pedidos de leitura expulsos por segundo por cada nó de consulta nos últimos dois minutos.sum(increase(milvus_querynode_read_evicted_count{app_kubernetes_io_instance=~"$instance", app_kubernetes_io_name="$app_name", namespace="$namespace"}[2m])/120) by (pod, node_id)milvus_querynode_sq_req_countO número acumulado de pedidos de leitura expulsos pelo nó de consulta devido a restrições de tráfego.

Coordenador de dados

PainelDescrição do painelPromQL (linguagem de consulta do Prometheus)As métricas Milvus utilizadasDescrição das métricas Milvus
Número do nó de dadosO número de nós de dados geridos pela coordenação de dados.sum(milvus_datacoord_datanode_num{app_kubernetes_io_instance=~"$instance", app_kubernetes_io_name="$app_name", namespace="$namespace"}) by (app_kubernetes_io_instance)milvus_datacoord_datanode_numO número de nós de dados geridos pelo coordenador de dados.
Número do segmentoO número de todos os tipos de segmentos registados nos metadados pelo coordenador de dados.sum(milvus_datacoord_segment_num{app_kubernetes_io_instance=~"$instance", app_kubernetes_io_name="$app_name", namespace="$namespace"}) by (segment_state)milvus_datacoord_segment_numO número de todos os tipos de segmentos registados nos metadados pelo coordenador de dados.
Os tipos de segmentos incluem: descartados, descarregados, descarregados, em crescimento e selados.
Número da coleçãoO número de colecções registadas nos metadados por coordenada de dados.sum(milvus_datacoord_collection_num{app_kubernetes_io_instance=~"$instance", app_kubernetes_io_name="$app_name", namespace="$namespace"}) by (app_kubernetes_io_instance)milvus_datacoord_collection_numO número de colecções registadas nos metadados por coordenada de dados.
Linhas armazenadasO número acumulado de linhas de dados válidos e descarregados na coordenada de dados.sum(milvus_datacoord_stored_rows_num{app_kubernetes_io_instance=~"$instance", app_kubernetes_io_name="$app_name", namespace="$namespace"}) by (app_kubernetes_io_instance)milvus_datacoord_stored_rows_numO número acumulado de linhas de dados válidos e descarregados na coordenada de dados.
Taxa de linhas armazenadasO número médio de linhas descarregadas por segundo nos últimos dois minutos.sum(increase(milvus_datacoord_stored_rows_count{app_kubernetes_io_instance=~"$instance", app_kubernetes_io_name="$app_name", namespace="$namespace"}[2m])/120) by (pod, node_id)milvus_datacoord_stored_rows_countO número acumulado de linhas descarregadas por coordenada de dados.
Tempo de sincronizaçãoO número médio, máximo e mínimo de tempo de época sincronizado pela coordenada de dados em cada canal físico.avg(milvus_datacoord_sync_epoch_time{app_kubernetes_io_instance=~"$instance", app_kubernetes_io_name="$app_name", namespace="$namespace"}) by (app_kubernetes_io_instance) max(milvus_datacoord_sync_epoch_time{app_kubernetes_io_instance=~"$instance", app_kubernetes_io_name="$app_name", namespace="$namespace"}) by (app_kubernetes_io_instance) min(milvus_datacoord_sync_epoch_time{app_kubernetes_io_instance=~"$instance", app_kubernetes_io_name="$app_name", namespace="$namespace"}) by (app_kubernetes_io_instance)milvus_datacoord_sync_epoch_timeA hora de época de cada canal físico (hora Unix, os milissegundos passados desde 1 de janeiro de 1970).
Tamanho do Binlog armazenadoO tamanho total do binlog armazenado.sum(milvus_datacoord_stored_binlog_size{app_kubernetes_io_instance=~"$instance", app_kubernetes_io_name="$app_name", namespace="$namespace"}) by (app_kubernetes_io_instance)milvus_datacoord_stored_binlog_sizeO tamanho total do binlog armazenado no Milvus.

Nó de dados

PainelDescrição do painelPromQL (linguagem de consulta do Prometheus)As métricas Milvus utilizadasDescrição da métrica Milvus
Número do fluxogramaO número de objectos do fluxograma que correspondem a cada nó de dados.sum(milvus_datanode_flowgraph_num{app_kubernetes_io_instance=~"$instance", app_kubernetes_io_name="$app_name", namespace="$namespace"}) by (pod, node_id)milvus_datanode_flowgraph_numO número de objectos do fluxograma.
Cada fragmento de uma coleção corresponde a um objeto de fluxograma.
Taxa de consumo de linhas de MsgO número de linhas de mensagens de fluxo contínuo consumidas por segundo por cada nó de dados nos últimos dois minutos.sum(increase(milvus_datanode_msg_rows_count{app_kubernetes_io_instance=~"$instance", app_kubernetes_io_name="$app_name", namespace="$namespace"}[2m])/120) by (msg_type, pod, node_id)milvus_datanode_msg_rows_countO número de linhas de mensagens de streaming consumidas.
Atualmente, as mensagens de streaming contadas por nó de dados apenas incluem mensagens de inserção e eliminação.
Taxa de tamanho de dados de descargaO tamanho de cada mensagem de descarga registada por segundo por cada nó de dados nos últimos dois minutos.sum(increase(milvus_datanode_flushed_data_size{app_kubernetes_io_instance=~"$instance", app_kubernetes_io_name="$app_name", namespace="$namespace"}[2m])/120) by (msg_type, pod, node_id)milvus_datanode_flushed_data_sizeO tamanho de cada mensagem descarregada.
Atualmente, as mensagens de streaming contadas por nó de dados apenas incluem mensagens de inserção e eliminação.
Número de consumidoresO número de consumidores criados em cada nó de dados.sum(milvus_datanode_consumer_num{app_kubernetes_io_instance=~"$instance", app_kubernetes_io_name="$app_name", namespace="$namespace"}) by (pod, node_id)milvus_datanode_consumer_numO número de consumidores criados em cada nó de dados.
Cada fluxograma corresponde a um consumidor.
Produtor NumO número de produtores criados em cada nó de dados.sum(milvus_datanode_producer_num{app_kubernetes_io_instance=~"$instance", app_kubernetes_io_name="$app_name", namespace="$namespace"}) by (pod, node_id)milvus_datanode_producer_numO número de consumidores criados em cada nó de dados.
Cada fragmento em uma coleção corresponde a um produtor de canal delta e um produtor de canal timetick.
Tempo de sincronizaçãoO número médio, máximo e mínimo de tempo de época sincronizado por cada nó de dados em todos os tópicos físicos.avg(milvus_datanode_sync_epoch_time{app_kubernetes_io_instance=~"$instance", app_kubernetes_io_name="$app_name", namespace="$namespace"}) by (pod, node_id) max(milvus_datanode_sync_epoch_time{app_kubernetes_io_instance=~"$instance", app_kubernetes_io_name="$app_name", namespace="$namespace"}) by (pod, node_id) min(milvus_datanode_sync_epoch_time{app_kubernetes_io_instance=~"$instance", app_kubernetes_io_name="$app_name", namespace="$namespace"}) by (pod, node_id)milvus_datanode_sync_epoch_timeA hora de época (hora Unix, os milissegundos passados desde 1 de janeiro de 1970) de cada tópico físico num nó de dados.
Número do segmento não descarregadoO número de segmentos não descarregados criados em cada nó de dados.sum(milvus_datanode_unflushed_segment_num{app_kubernetes_io_instance=~"$instance", app_kubernetes_io_name="$app_name", namespace="$namespace"}) by (pod, node_id)milvus_datanode_unflushed_segment_numO número de segmentos não descarregados criados em cada nó de dados.
Latência do buffer de codificaçãoA latência média e o 99º percentil do tempo usado para codificar um buffer por cada nó de dados nos últimos dois minutos.p99:
histogram_quantile(0.99, sum by (le, pod, node_id) (rate(milvus_datanode_encode_buffer_latency_bucket{app_kubernetes_io_instance=~"$instance", app_kubernetes_io_name="$app_name", namespace="$namespace"}[2m])))
avg:
sum(increase(milvus_datanode_encode_buffer_latency_sum{app_kubernetes_io_instance=~"$instance", app_kubernetes_io_name="$app_name", namespace="$namespace"}[2m])) by(pod, node_id) / sum(increase(milvus_datanode_encode_buffer_latency_count{app_kubernetes_io_instance=~"$instance", app_kubernetes_io_name="$app_name", namespace="$namespace"}[2m])) by(pod, node_id)
milvus_datanode_encode_buffer_latencyO tempo que cada nó de dados leva para codificar um buffer.
Salvar latência de dadosA latência média e o percentil 99 do tempo usado para gravar um buffer na camada de armazenamento por cada nó de dados nos últimos dois minutos.p99:
histogram_quantile(0.99, sum by (le, pod, node_id) (rate(milvus_datanode_save_latency_bucket{app_kubernetes_io_instance=~"$instance", app_kubernetes_io_name="$app_name", namespace="$namespace"}[2m])))
avg:
sum(increase(milvus_datanode_save_latency_sum{app_kubernetes_io_instance=~"$instance", app_kubernetes_io_name="$app_name", namespace="$namespace"}[2m])) by(pod, node_id) / sum(increase(milvus_datanode_save_latency_count{app_kubernetes_io_instance=~"$instance", app_kubernetes_io_name="$app_name", namespace="$namespace"}[2m])) by(pod, node_id)
milvus_datanode_save_latencyO tempo que cada nó de dados leva para gravar um buffer na camada de armazenamento.
Taxa de operação de descargaO número de vezes que cada nó de dados descarrega um buffer por segundo nos últimos dois minutos.sum(increase(milvus_datanode_flush_buffer_op_count{app_kubernetes_io_instance=~"$instance", app_kubernetes_io_name="$app_name", namespace="$namespace"}[2m])/120) by (status, pod, node_id)milvus_datanode_flush_buffer_op_countO número acumulado de vezes que um nó de dados descarrega um buffer.
Taxa de operação de autoflushO número de vezes que cada nó de dados faz a descarga automática de um buffer por segundo nos últimos dois minutos.sum(increase(milvus_datanode_autoflush_buffer_op_count{app_kubernetes_io_instance=~"$instance", app_kubernetes_io_name="$app_name", namespace="$namespace"}[2m])/120) by (status, pod, node_id)milvus_datanode_autoflush_buffer_op_countO número acumulado de vezes que um nó de dados faz a autolimpeza de um buffer.
Taxa de solicitação de descargaO número de vezes que cada nó de dados recebe uma solicitação de descarga de buffer por segundo nos últimos dois minutos.sum(increase(milvus_datanode_flush_req_count{app_kubernetes_io_instance=~"$instance", app_kubernetes_io_name="$app_name", namespace="$namespace"}[2m])/120) by (status, pod, node_id)milvus_datanode_flush_req_countO número acumulado de vezes que um nó de dados recebe uma solicitação de descarga de uma coordenada de dados.
Latência de compactaçãoA latência média e o percentil 99 do tempo que cada nó de dados leva para executar uma tarefa de compactação nos últimos dois minutos.p99:
histogram_quantile(0.99, sum by (le, pod, node_id) (rate(milvus_datanode_compaction_latency_bucket{app_kubernetes_io_instance=~"$instance", app_kubernetes_io_name="$app_name", namespace="$namespace"}[2m])))
avg:
sum(increase(milvus_datanode_compaction_latency_sum{app_kubernetes_io_instance=~"$instance", app_kubernetes_io_name="$app_name", namespace="$namespace"}[2m])) by(pod, node_id) / sum(increase(milvus_datanode_compaction_latency_count{app_kubernetes_io_instance=~"$instance", app_kubernetes_io_name="$app_name", namespace="$namespace"}[2m])) by(pod, node_id)
milvus_datanode_compaction_latencyO tempo que cada nó de dados leva para executar uma tarefa de compactação.

Coordenador de índices

PainelDescrição do painelPromQL (linguagem de consulta Prometheus)As métricas Milvus utilizadasDescrição das métricas do Milvus
Taxa de solicitação de índiceO número médio de pedidos de criação de índices recebidos por segundo nos últimos dois minutos.sum(increase(milvus_indexcoord_indexreq_count{app_kubernetes_io_instance=~"$instance", app_kubernetes_io_name="$app_name", namespace="$namespace"}[2m])/120) by (status)milvus_indexcoord_indexreq_countO número de pedidos de criação de índices recebidos.
Contagem de tarefas de índiceA contagem de todas as tarefas de indexação registadas nos metadados do índice.sum(milvus_indexcoord_indextask_count{app_kubernetes_io_instance=~"$instance", app_kubernetes_io_name="$app_name", namespace="$namespace"}) by (index_task_status)milvus_indexcoord_indextask_countA contagem de todas as tarefas de indexação registadas nos metadados do índice.
Número do nó de índiceO número de nós de índice geridos.sum(milvus_indexcoord_indexnode_num{app_kubernetes_io_instance=~"$instance", app_kubernetes_io_name="$app_name", namespace="$namespace"}) by (app_kubernetes_io_instance)milvus_indexcoord_indexnode_numO número de nós de índice geridos.

Nó de índice

PainelDescrição do painelPromQL (linguagem de consulta do Prometheus)As métricas Milvus utilizadasDescrição das métricas do Milvus
Taxa de tarefas de índiceO número médio de tarefas de criação de índices recebidas por cada nó de índice por segundo nos últimos dois minutos.sum(increase(milvus_indexnode_index_task_count{app_kubernetes_io_instance=~"$instance", app_kubernetes_io_name="$app_name", namespace="$namespace"}[2m])/120) by (status, pod, node_id)milvus_indexnode_index_task_countO número de tarefas de criação de índices recebidas.
Latência do campo de cargaA latência média e o percentil 99 do tempo utilizado por cada nó de índice para carregar os dados do campo de segmento de cada vez nos últimos dois minutos.p99:
histogram_quantile(0.99, sum by (le, pod, node_id) (rate(milvus_indexnode_load_field_latency_bucket{app_kubernetes_io_instance=~"$instance", app_kubernetes_io_name="$app_name", namespace="$namespace"}[2m])))
avg:
sum(increase(milvus_indexnode_load_field_latency_sum{app_kubernetes_io_instance=~"$instance", app_kubernetes_io_name="$app_name", namespace="$namespace"}[2m])) by(pod, node_id) / sum(increase(milvus_indexnode_load_field_latency_count{app_kubernetes_io_instance=~"$instance", app_kubernetes_io_name="$app_name", namespace="$namespace"}[2m])) by(pod, node_id)
milvus_indexnode_load_field_latencyO tempo usado pelo nó de índice para carregar os dados do campo de segmento.
Latência do campo de descodificaçãoA latência média e o percentil 99 do tempo utilizado por cada nó de índice para codificar dados de campo de cada vez nos últimos dois minutos.p99:
histogram_quantile(0.99, sum by (le, pod, node_id) (rate(milvus_indexnode_decode_field_latency_bucket{app_kubernetes_io_instance=~"$instance", app_kubernetes_io_name="$app_name", namespace="$namespace"}[2m])))
avg:
sum(increase(milvus_indexnode_decode_field_latency_sum{app_kubernetes_io_instance=~"$instance", app_kubernetes_io_name="$app_name", namespace="$namespace"}[2m])) by(pod, node_id) / sum(increase(milvus_indexnode_decode_field_latency_count{app_kubernetes_io_instance=~"$instance", app_kubernetes_io_name="$app_name", namespace="$namespace"}[2m])) by(pod, node_id)
milvus_indexnode_decode_field_latencyO tempo usado para decodificar os dados de campo.
Latência do índice de construçãoA latência média e o percentil 99 do tempo utilizado por cada nó de índice para criar índices nos últimos dois minutos.p99:
histogram_quantile(0.99, sum by (le, pod, node_id) (rate(milvus_indexnode_build_index_latency_bucket{app_kubernetes_io_instance=~"$instance", app_kubernetes_io_name="$app_name", namespace="$namespace"}[2m])))
avg:
sum(increase(milvus_indexnode_build_index_latency_sum{app_kubernetes_io_instance=~"$instance", app_kubernetes_io_name="$app_name", namespace="$namespace"}[2m])) by(pod, node_id) / sum(increase(milvus_indexnode_build_index_latency_count{app_kubernetes_io_instance=~"$instance", app_kubernetes_io_name="$app_name", namespace="$namespace"}[2m])) by(pod, node_id)
milvus_indexnode_build_index_latencyO tempo usado para criar índices.
Codificar a latência do índiceA latência média e o percentil 99 do tempo utilizado por cada nó de índice para codificar ficheiros de índice nos últimos dois minutos.p99:
histogram_quantile(0.99, sum by (le, pod, node_id) (rate(milvus_indexnode_encode_index_latency_bucket{app_kubernetes_io_instance=~"$instance", app_kubernetes_io_name="$app_name", namespace="$namespace"}[2m])))
avg:
sum(increase(milvus_indexnode_encode_index_latency_sum{app_kubernetes_io_instance=~"$instance", app_kubernetes_io_name="$app_name", namespace="$namespace"}[2m])) by(pod, node_id) / sum(increase(milvus_indexnode_encode_index_latency_count{app_kubernetes_io_instance=~"$instance", app_kubernetes_io_name="$app_name", namespace="$namespace"}[2m])) by(pod, node_id)
milvus_indexnode_encode_index_latencyO tempo utilizado para codificar ficheiros de índice.
Guardar a latência do índiceA latência média e o percentil 99 do tempo utilizado por cada nó de índice para guardar ficheiros de índice nos últimos dois minutos.p99:
histogram_quantile(0.99, sum by (le, pod, node_id) (rate(milvus_indexnode_save_index_latency_bucket{app_kubernetes_io_instance=~"$instance", app_kubernetes_io_name="$app_name", namespace="$namespace"}[2m])))
avg:
sum(increase(milvus_indexnode_save_index_latency_sum{app_kubernetes_io_instance=~"$instance", app_kubernetes_io_name="$app_name", namespace="$namespace"}[2m])) by(pod, node_id) / sum(increase(milvus_indexnode_save_index_latency_count{app_kubernetes_io_instance=~"$instance", app_kubernetes_io_name="$app_name", namespace="$namespace"}[2m])) by(pod, node_id)
milvus_indexnode_save_index_latencyO tempo utilizado para guardar ficheiros de índice.

Traduzido porDeepLogo

Tabela de conteúdos
Feedback

Esta página foi útil?