Painel de Métricas do Milvus
O Milvus gera uma lista de métricas detalhadas de séries temporais durante o tempo de execução. Você pode usar o Prometheus e o Grafana para visualizar as métricas. Este tópico apresenta as métricas de monitoramento exibidas no Grafana Milvus Dashboard.
A unidade de tempo neste tópico é milissegundos. E "percentil 99" neste tópico refere-se ao fato de que 99% das estatísticas de tempo são controladas dentro de um determinado valor.
Recomendamos a leitura da visão geral da estrutura de monitoramento do Milvus para entender primeiro as métricas do Prometheus.
Proxy
Painel | Descrição do painel | PromQL (linguagem de consulta do Prometheus) | As métricas do Milvus usadas | Descrição das métricas do Milvus |
---|---|---|---|---|
Taxa de contagem de vetores de pesquisa | O número médio de vectores consultados por segundo por cada proxy nos últimos dois minutos. | sum(increase(milvus_proxy_search_vectors_count{app_kubernetes_io_instance=~"$instance", app_kubernetes_io_name="$app_name", namespace="$namespace"}[2m])/120) by (pod, node_id) | milvus_proxy_search_vectors_count | O número acumulado de vectores consultados. |
Taxa de contagem de vectores de inserção | O número médio de vectores inseridos por segundo por cada proxy nos últimos dois minutos. | sum(increase(milvus_proxy_insert_vectors_count{app_kubernetes_io_instance=~"$instance", app_kubernetes_io_name="$app_name", namespace="$namespace"}[2m])/120) by (pod, node_id) | milvus_proxy_insert_vectors_count | O número acumulado de vectores inseridos. |
Latência de pesquisa | A latência média e o percentil 99 da latência de receção de pedidos de pesquisa e consulta por cada proxy nos últimos dois minutos. | p99: histogram_quantile(0.99, sum by (le, query_type, pod, node_id) (rate(milvus_proxy_sq_latency_bucket{app_kubernetes_io_instance=~"$instance", app_kubernetes_io_name="$app_name", namespace="$namespace"}[2m]))) avg: sum(increase(milvus_proxy_sq_latency_sum{app_kubernetes_io_instance=~"$instance", app_kubernetes_io_name="$app_name", namespace="$namespace"}[2m])) by (pod, node_id, query_type) / sum(increase(milvus_proxy_sq_latency_count{app_kubernetes_io_instance=~"$instance", app_kubernetes_io_name="$app_name", namespace="$namespace"}[2m])) by (pod, node_id, query_type) | milvus_proxy_sq_latency | A latência dos pedidos de pesquisa e consulta. |
Latência de pesquisa de colecções | A latência média e o percentil 99 da latência da receção de pedidos de pesquisa e consulta para uma coleção específica por cada proxy nos últimos dois minutos. | p99: histogram_quantile(0.99, sum by (le, query_type, pod, node_id) (rate(milvus_proxy_collection_sq_latency_bucket{app_kubernetes_io_instance=~"$instance", app_kubernetes_io_name="$app_name", namespace="$namespace", collection_name=~"$collection"}[2m]))) avg: sum(increase(milvus_proxy_collection_sq_latency_sum{app_kubernetes_io_instance=~"$instance", app_kubernetes_io_name="$app_name", namespace="$namespace", collection_name=~"$collection"}[2m])) by (pod, node_id, query_type) / sum(increase(milvus_proxy_collection_sq_latency_count{app_kubernetes_io_instance=~"$instance", app_kubernetes_io_name="$app_name", namespace="$namespace", collection_name=~"$collection"}[2m])) by (pod, node_id, query_type) | milvus_proxy_collection_sq_latency_sum | A latência dos pedidos de pesquisa e consulta para uma coleção específica |
Latência de mutação | A latência média e o percentil 99 da latência da receção de pedidos de mutação por cada proxy nos últimos dois minutos. | p99: histogram_quantile(0.99, sum by (le, msg_type, pod, node_id) (rate(milvus_proxy_mutation_latency_bucket{app_kubernetes_io_instance=~"$instance", app_kubernetes_io_name="$app_name", namespace="$namespace"}[2m]))) avg: sum(increase(milvus_proxy_mutation_latency_sum{app_kubernetes_io_instance=~"$instance", app_kubernetes_io_name="$app_name", namespace="$namespace"}[2m])) by (pod, node_id, msg_type) / sum(increase(milvus_proxy_mutation_latency_count{app_kubernetes_io_instance=~"$instance", app_kubernetes_io_name="$app_name", namespace="$namespace"}[2m])) by (pod, node_id, msg_type) | milvus_proxy_mutation_latency_sum | A latência dos pedidos de mutação. |
Latência de mutação da coleção | A latência média e o percentil 99 da latência da receção de pedidos de mutação para uma coleção específica por cada proxy nos últimos dois minutos. | p99: histogram_quantile(0.99, sum by (le, query_type, pod, node_id) (rate(milvus_proxy_collection_sq_latency_bucket{app_kubernetes_io_instance=~"$instance", app_kubernetes_io_name="$app_name", namespace="$namespace", collection_name=~"$collection"}[2m]))) avg: sum(increase(milvus_proxy_collection_sq_latency_sum{app_kubernetes_io_instance=~"$instance", app_kubernetes_io_name="$app_name", namespace="$namespace", collection_name=~"$collection"}[2m])) by (pod, node_id, query_type) / sum(increase(milvus_proxy_collection_sq_latency_count{app_kubernetes_io_instance=~"$instance", app_kubernetes_io_name="$app_name", namespace="$namespace", collection_name=~"$collection"}[2m])) by (pod, node_id, query_type) | milvus_proxy_collection_sq_latency_sum | A latência dos pedidos de mutação para uma coleção específica |
Latência do resultado da pesquisa de espera | A latência média e o percentil 99 da latência entre o envio de pedidos de pesquisa e consulta e a receção de resultados por proxy nos últimos dois minutos. | p99: histogram_quantile(0.99, sum by (le, query_type, pod, node_id) (rate(milvus_proxy_sq_wait_result_latency_bucket{app_kubernetes_io_instance=~"$instance", app_kubernetes_io_name="$app_name", namespace="$namespace"}[2m]))) avg: sum(increase(milvus_proxy_sq_wait_result_latency_sum{app_kubernetes_io_instance=~"$instance", app_kubernetes_io_name="$app_name", namespace="$namespace"}[2m])) by (pod, node_id, query_type) / sum(increase(milvus_proxy_sq_wait_result_latency_count{app_kubernetes_io_instance=~"$instance", app_kubernetes_io_name="$app_name", namespace="$namespace"}[2m])) by (pod, node_id, query_type) | milvus_proxy_sq_wait_result_latency | A latência entre o envio de pedidos de pesquisa e consulta e a receção de resultados. |
Reduzir a latência dos resultados da pesquisa | A latência média e o percentil 99 da latência da agregação de resultados de pesquisa e consulta por proxy nos últimos dois minutos. | p99: histogram_quantile(0.99, sum by (le, query_type, pod, node_id) (rate(milvus_proxy_sq_reduce_result_latency_bucket{app_kubernetes_io_instance=~"$instance", app_kubernetes_io_name="$app_name", namespace="$namespace"}[2m]))) avg: sum(increase(milvus_proxy_sq_reduce_result_latency_sum{app_kubernetes_io_instance=~"$instance", app_kubernetes_io_name="$app_name", namespace="$namespace"}[2m])) by (pod, node_id, query_type) / sum(increase(milvus_proxy_sq_reduce_result_latency_count{app_kubernetes_io_instance=~"$instance", app_kubernetes_io_name="$app_name", namespace="$namespace"}[2m])) by (pod, node_id, query_type) | milvus_proxy_sq_reduce_result_latency | A latência da agregação dos resultados de pesquisa e consulta retornados por cada nó de consulta. |
Latência de descodificação dos resultados da pesquisa | A latência média e o percentil 99 da latência da descodificação de resultados de pesquisa e consulta por proxy nos últimos dois minutos. | p99: histogram_quantile(0.99, sum by (le, query_type, pod, node_id) (rate(milvus_proxy_sq_decode_result_latency_bucket{app_kubernetes_io_instance=~"$instance", app_kubernetes_io_name="$app_name", namespace="$namespace"}[2m]))) avg: sum(increase(milvus_proxy_sq_decode_result_latency_sum{app_kubernetes_io_instance=~"$instance", app_kubernetes_io_name="$app_name", namespace="$namespace"}[2m])) by (pod, node_id, query_type) / sum(increase(milvus_proxy_sq_decode_resultlatency_count{app_kubernetes_io_instance=~"$instance", app_kubernetes_io_name="$app_name", namespace="$namespace"}[2m])) by (pod, node_id, query_type) | milvus_proxy_sq_decode_result_latency | A latência da descodificação de cada resultado de pesquisa e consulta. |
Número de objectos de fluxo de mensagens | O número médio, máximo e mínimo dos objectos msgstream criados por cada proxy no tópico físico correspondente nos últimos dois minutos. | avg(milvus_proxy_msgstream_obj_num{app_kubernetes_io_instance=~"$instance", app_kubernetes_io_name="$app_name", namespace="$namespace"}) by (pod, node_id) max(milvus_proxy_msgstream_obj_num{app_kubernetes_io_instance=~"$instance", app_kubernetes_io_name="$app_name", namespace="$namespace"}) by (pod, node_id) min(milvus_proxy_msgstream_obj_num{app_kubernetes_io_instance=~"$instance", app_kubernetes_io_name="$app_name", namespace="$namespace"}) by (pod, node_id) | milvus_proxy_msgstream_obj_num | O número de objetos msgstream criados em cada tópico físico. |
Latência de envio de mutação | A latência média e o percentil 99 da latência do envio de solicitações de inserção ou exclusão por cada proxy nos últimos dois minutos. | p99: histogram_quantile(0.99, sum by (le, msg_type, pod, node_id) (rate(milvus_proxy_mutation_send_latency_bucket{app_kubernetes_io_instance=~"$instance", app_kubernetes_io_name="$app_name", namespace="$namespace"}[2m]))) avg: sum(increase(milvus_proxy_mutation_send_latency_sum{app_kubernetes_io_instance=~"$instance", app_kubernetes_io_name="$app_name", namespace="$namespace"}[2m])) by (pod, node_id, msg_type) / sum(increase(milvus_proxy_mutation_send_latency_count{app_kubernetes_io_instance=~"$instance", app_kubernetes_io_name="$app_name", namespace="$namespace"}[2m])) by (pod, node_id, msg_type) | milvus_proxy_mutation_send_latency | A latência do envio de solicitações de inserção ou exclusão. |
Taxa de acerto da cache | A taxa média de acerto da cache de operações incluindo GeCollectionID , GetCollectionInfo e GetCollectionSchema por segundo nos últimos dois minutos. | sum(increase(milvus_proxy_cache_hit_count{app_kubernetes_io_instance=~"$instance", app_kubernetes_io_name="$app_name", namespace="$namespace", cache_state="hit"}[2m])/120) by(cache_name, pod, node_id) / sum(increase(milvus_proxy_cache_hit_count{app_kubernetes_io_instance=~"$instance", app_kubernetes_io_name="$app_name", namespace="$namespace"}[2m])/120) by(cache_name, pod, node_id) | milvus_proxy_cache_hit_count | As estatísticas da taxa de acerto e falha de cada operação de leitura da cache. |
Latência de atualização da cache | A latência média e o percentil 99 da latência de atualização da cache por proxy nos últimos dois minutos. | p99: histogram_quantile(0.99, sum by (le, pod, node_id) (rate(milvus_proxy_cache_update_latency_bucket{app_kubernetes_io_instance=~"$instance", app_kubernetes_io_name="$app_name", namespace="$namespace"}[2m]))) avg: sum(increase(milvus_proxy_cache_update_latency_sum{app_kubernetes_io_instance=~"$instance", app_kubernetes_io_name="$app_name", namespace="$namespace"}[2m])) by (pod, node_id) / sum(increase(milvus_proxy_cache_update_latency_count{app_kubernetes_io_instance=~"$instance", app_kubernetes_io_name="$app_name", namespace="$namespace"}[2m])) by (pod, node_id) | milvus_proxy_cache_update_latency | A latência da atualização da cache de cada vez. |
Tempo de sincronização | O número médio, máximo e mínimo de tempo de época sincronizado por cada proxy em seu canal físico correspondente. | avg(milvus_proxy_sync_epoch_time{app_kubernetes_io_instance=~"$instance", app_kubernetes_io_name="$app_name", namespace="$namespace"}) by (pod, node_id) max(milvus_proxy_sync_epoch_time{app_kubernetes_io_instance=~"$instance", app_kubernetes_io_name="$app_name", namespace="$namespace"}) by (pod, node_id) min(milvus_proxy_sync_epoch_time{app_kubernetes_io_instance=~"$instance", app_kubernetes_io_name="$app_name", namespace="$namespace"}) by (pod, node_id) | milvus_proxy_sync_epoch_time | A hora de época de cada canal físico (hora Unix, os milissegundos passados desde 1 de janeiro de 1970). Existe uma predefinição ChannelName para além dos canais físicos. |
Aplicar latência PK | A latência média e o percentil 99 da latência da aplicação da chave primária por cada proxy nos últimos dois minutos. | p99: histogram_quantile(0.99, sum by (le, pod, node_id) (rate(milvus_proxy_apply_pk_latency_bucket{app_kubernetes_io_instance=~"$instance", app_kubernetes_io_name="$app_name", namespace="$namespace"}[2m]))) avg: sum(increase(milvus_proxy_apply_pk_latency_sum{app_kubernetes_io_instance=~"$instance", app_kubernetes_io_name="$app_name", namespace="$namespace"}[2m])) by (pod, node_id) / sum(increase(milvus_proxy_apply_pk_latency_count{app_kubernetes_io_instance=~"$instance", app_kubernetes_io_name="$app_name", namespace="$namespace"}[2m])) by (pod, node_id) | milvus_proxy_apply_pk_latency | A latência da aplicação da chave primária. |
Latência de aplicação de carimbo de data/hora | A latência média e o percentil 99 da latência da aplicação do carimbo de data/hora por cada proxy nos últimos dois minutos. | p99: histogram_quantile(0.99, sum by (le, pod, node_id) (rate(milvus_proxy_apply_timestamp_latency_bucket{app_kubernetes_io_instance=~"$instance", app_kubernetes_io_name="$app_name", namespace="$namespace"}[2m]))) avg: sum(increase(milvus_proxy_apply_timestamp_latency_sum{app_kubernetes_io_instance=~"$instance", app_kubernetes_io_name="$app_name", namespace="$namespace"}[2m])) by (pod, node_id) / sum(increase(milvus_proxy_apply_timestamp_latency_count{app_kubernetes_io_instance=~"$instance", app_kubernetes_io_name="$app_name", namespace="$namespace"}[2m])) by (pod, node_id) | milvus_proxy_apply_timestamp_latency | A latência da aplicação do carimbo de data/hora. |
Taxa de sucesso do pedido | O número de solicitações bem-sucedidas recebidas por segundo por cada proxy, com uma análise detalhada de cada tipo de solicitação. Os tipos de pedido possíveis são DescribeCollection, DescribeIndex, GetCollectionStatistics, HasCollection, Search, Query, ShowPartitions, Insert, etc. | |||
sum(increase(milvus_proxy_req_count{app_kubernetes_io_instance=~"$instance", app_kubernetes_io_name="$app_name", namespace="$namespace", status="success"}[2m])/120) by(function_name, pod, node_id) | milvus_proxy_req_count | O número de todos os tipos de pedidos recebidos | ||
Taxa de pedidos falhados | O número de pedidos falhados recebidos por segundo por cada proxy, com uma análise detalhada de cada tipo de pedido. Os tipos de pedido possíveis são DescribeCollection, DescribeIndex, GetCollectionStatistics, HasCollection, Search, Query, ShowPartitions, Insert, etc. | |||
sum(increase(milvus_proxy_req_count{app_kubernetes_io_instance=~"$instance", app_kubernetes_io_name="$app_name", namespace="$namespace", status="fail"}[2m])/120) by(function_name, pod, node_id) | milvus_proxy_req_count | O número de todos os tipos de pedidos recebidos | ||
Latência do pedido | A latência média e o percentil 99 da latência de todos os tipos de pedidos recebidos por cada proxy | p99: histogram_quantile(0.99, sum by (le, pod, node_id, function_name) (rate(milvus_proxy_req_latency_bucket{app_kubernetes_io_instance=~"$instance", app_kubernetes_io_name="$app_name", namespace="$namespace"}[2m]))) avg: sum(increase(milvus_proxy_req_latency_sum{app_kubernetes_io_instance=~"$instance", app_kubernetes_io_name="$app_name", namespace="$namespace"}[2m])) by (pod, node_id, function_name) / sum(increase(milvus_proxy_req_latency_count{app_kubernetes_io_instance=~"$instance", app_kubernetes_io_name="$app_name", namespace="$namespace"}[2m])) by (pod, node_id, function_name) | milvus_proxy_req_latency | A latência de todos os tipos de pedidos de receção |
Taxa de bytes de pedidos de inserção/eliminação | O número de bytes de pedidos de inserção e exclusão recebidos por segundo pelo proxy nos últimos dois minutos. | sum(increase(milvus_proxy_receive_bytes_count{app_kubernetes_io_instance=~"$instance", app_kubernetes_io_name="$app_name", namespace="$namespace"}[2m])/120) by(pod, node_id) | milvus_proxy_receive_bytes_count | A contagem de pedidos de inserção e exclusão. |
Taxa de envio de bytes | O número de bytes por segundo enviados de volta para o cliente enquanto cada proxy está a responder a pedidos de pesquisa e consulta nos últimos dois minutos. | sum(increase(milvus_proxy_send_bytes_count{app_kubernetes_io_instance=~"$instance", app_kubernetes_io_name="$app_name", namespace="$namespace"}[2m])/120) by(pod, node_id) | milvus_proxy_send_bytes_count | O número de bytes enviados de volta ao cliente enquanto cada proxy está a responder a pedidos de pesquisa e consulta. |
Coordenador raiz
Painel | Descrição do painel | PromQL (linguagem de consulta do Prometheus) | As métricas Milvus utilizadas | Descrição das métricas do Milvus |
---|---|---|---|---|
Número do nó de proxy | O número de proxies criados. | sum(milvus_rootcoord_proxy_num{app_kubernetes_io_instance=~"$instance", app_kubernetes_io_name="$app_name", namespace="$namespace"}) by (app_kubernetes_io_instance) | milvus_rootcoord_proxy_num | O número de proxies. |
Tempo de sincronização | O número médio, máximo e mínimo de tempo de época sincronizado por cada coordenada raiz em cada canal físico (PChannel). | avg(milvus_rootcoord_sync_epoch_time{app_kubernetes_io_instance=~"$instance", app_kubernetes_io_name="$app_name", namespace="$namespace"}) by (app_kubernetes_io_instance) max(milvus_rootcoord_sync_epoch_time{app_kubernetes_io_instance=~"$instance", app_kubernetes_io_name="$app_name", namespace="$namespace"}) by (app_kubernetes_io_instance) min(milvus_rootcoord_sync_epoch_time{app_kubernetes_io_instance=~"$instance", app_kubernetes_io_name="$app_name", namespace="$namespace"}) by (app_kubernetes_io_instance) | milvus_rootcoord_sync_epoch_time | A hora de época de cada canal físico (hora Unix, os milissegundos passados desde 1 de janeiro de 1970). |
Taxa de solicitação DDL | O status e o número de solicitações DDL por segundo nos últimos dois minutos. | sum(increase(milvus_rootcoord_ddl_req_count{app_kubernetes_io_instance=~"$instance", app_kubernetes_io_name="$app_name", namespace="$namespace"}[2m])/120) by (status, function_name) | milvus_rootcoord_ddl_req_count | O número total de solicitações DDL, incluindo CreateCollection , DescribeCollection , DescribeSegments , HasCollection , ShowCollections , ShowPartitions , e ShowSegments . |
Latência do pedido DDL | A latência média e o percentil 99 da latência do pedido DDL nos últimos dois minutos. | p99: histogram_quantile(0.99, sum by (le, function_name) (rate(milvus_rootcoord_ddl_req_latency_bucket{app_kubernetes_io_instance=~"$instance", app_kubernetes_io_name="$app_name", namespace="$namespace"}[2m]))) avg: sum(increase(milvus_rootcoord_ddl_req_latency_sum{app_kubernetes_io_instance=~"$instance", app_kubernetes_io_name="$app_name", namespace="$namespace"}[2m])) by (function_name) / sum(increase(milvus_rootcoord_ddl_req_latency_count{app_kubernetes_io_instance=~"$instance", app_kubernetes_io_name="$app_name", namespace="$namespace"}[2m])) by (function_name) | milvus_rootcoord_ddl_req_latency | A latência de todos os tipos de solicitações DDL. |
Latência de sincronização Timetick | A latência média e o percentil 99 do tempo usado pela coordenada raiz para sincronizar todos os carimbos de data/hora com o PChannel nos últimos dois minutos. | p99: histogram_quantile(0.99, sum by (le) (rate(milvus_rootcoord_sync_timetick_latency_bucket{app_kubernetes_io_instance=~"$instance", app_kubernetes_io_name="$app_name", namespace="$namespace"}[2m]))) avg: sum(increase(milvus_rootcoord_sync_timetick_latency_sum{app_kubernetes_io_instance=~"$instance", app_kubernetes_io_name="$app_name", namespace="$namespace"}[2m])) / sum(increase(milvus_rootcoord_sync_timetick_latency_count{app_kubernetes_io_instance=~"$instance", app_kubernetes_io_name="$app_name", namespace="$namespace"}[2m])) | milvus_rootcoord_sync_timetick_latency | o tempo usado pelo coordenador raiz para sincronizar todos os carimbos de data/hora com o pchannel. |
Taxa de atribuição de ID | O número de IDs atribuídos pela coordenada raiz por segundo nos últimos dois minutos. | sum(increase(milvus_rootcoord_id_alloc_count{app_kubernetes_io_instance=~"$instance", app_kubernetes_io_name="$app_name", namespace="$namespace"}[2m])/120) | milvus_rootcoord_id_alloc_count | O número acumulado de IDs atribuídos pela coord raiz. |
Carimbo de Tempo | O carimbo de data/hora mais recente da coordenada raiz. | milvus_rootcoord_timestamp{app_kubernetes_io_instance=~"$instance", app_kubernetes_io_name="$app_name", namespace="$namespace"} | milvus_rootcoord_timestamp | O carimbo de data/hora mais recente da coordenada raiz. |
Carimbo de data/hora guardado | Os carimbos de data/hora pré-atribuídos que a coord. raiz guarda no meta-armazenamento. | milvus_rootcoord_timestamp_saved{app_kubernetes_io_instance=~"$instance", app_kubernetes_io_name="$app_name", namespace="$namespace"} | milvus_rootcoord_timestamp_saved | Os carimbos de data/hora pré-atribuídos que a coordenada de raiz guarda no meta armazenamento. Os carimbos de data/hora são atribuídos 3 segundos antes. E o carimbo de data/hora é atualizado e guardado no meta storage a cada 50 milissegundos. |
Número da coleção | O número total de colecções. | sum(milvus_rootcoord_collection_num{app_kubernetes_io_instance=~"$instance", app_kubernetes_io_name="$app_name", namespace="$namespace"}) by (app_kubernetes_io_instance) | milvus_rootcoord_collection_num | O número total de colecções existentes no Milvus atualmente. |
Número da partição | O número total de partições. | sum(milvus_rootcoord_partition_num{app_kubernetes_io_instance=~"$instance", app_kubernetes_io_name="$app_name", namespace="$namespace"}) by (app_kubernetes_io_instance) | milvus_rootcoord_partition_num | O número total de partições existentes no Milvus atualmente. |
Número do canal DML | O número total de canais DML. | sum(milvus_rootcoord_dml_channel_num{app_kubernetes_io_instance=~"$instance", app_kubernetes_io_name="$app_name", namespace="$namespace"}) by (app_kubernetes_io_instance) | milvus_rootcoord_dml_channel_num | O número total de canais DML existentes no Milvus atualmente. |
Msgstream Num | O número total de msgstreams. | sum(milvus_rootcoord_msgstream_obj_num{app_kubernetes_io_instance=~"$instance", app_kubernetes_io_name="$app_name", namespace="$namespace"}) by (app_kubernetes_io_instance) | milvus_rootcoord_msgstream_obj_num | O número total de msgstreams existentes atualmente no Milvus. |
Número de credenciais | O número total de credenciais. | sum(milvus_rootcoord_credential_num{app_kubernetes_io_instance=~"$instance", app_kubernetes_io_name="$app_name", namespace="$namespace"}) by (app_kubernetes_io_instance) | milvus_rootcoord_credential_num | O número total de credenciais existentes atualmente no Milvus. |
Tempo de atraso do tique-taque | A soma do tempo máximo de atraso dos gráficos de fluxo em todos os DataNodes e QueryNodes. | sum(milvus_rootcoord_time_tick_delay{app_kubernetes_io_instance=~"$instance", app_kubernetes_io_name="$app_name", namespace="$namespace"}) by (app_kubernetes_io_instance) | milvus_rootcoord_time_tick_delay | O tempo máximo de atraso dos gráficos de fluxo em cada DataNode e QueryNode. |
Coordenador de consultas
Painel | Descrição do painel | PromQL (linguagem de consulta do Prometheus) | As métricas Milvus utilizadas | Descrição das métricas Milvus |
---|---|---|---|---|
Número de colecções carregadas | O número de colecções que estão atualmente carregadas na memória. | sum(milvus_querycoord_collection_num{app_kubernetes_io_instance=~"$instance", app_kubernetes_io_name="$app_name", namespace="$namespace"}) by (app_kubernetes_io_instance) | milvus_querycoord_collection_num | O número de colecções que estão atualmente carregadas pelo Milvus. |
Entidade carregada | O número de entidades que estão atualmente carregadas na memória. | sum(milvus_querycoord_entity_num{app_kubernetes_io_instance=~"$instance", app_kubernetes_io_name="$app_name", namespace="$namespace"}) by (app_kubernetes_io_instance) | milvus_querycoord_entitiy_num | O número de entidades que estão atualmente carregadas pelo Milvus. |
Taxa de pedidos de carregamento | O número de pedidos de carregamento por segundo nos últimos dois minutos. | sum(increase(milvus_querycoord_load_req_count{app_kubernetes_io_instance=~"$instance", app_kubernetes_io_name="$app_name", namespace="$namespace"}[2m])120) by (status) | milvus_querycoord_load_req_count | O número acumulado de solicitações de carga. |
Taxa de solicitação de liberação | O número de solicitações de liberação por segundo nos últimos dois minutos. | sum(increase(milvus_querycoord_release_req_count{app_kubernetes_io_instance=~"$instance", app_kubernetes_io_name="$app_name", namespace="$namespace"}[2m])/120) by (status) | milvus_querycoord_release_req_count | O número acumulado de solicitações de liberação. |
Latência de solicitação de carga | A latência média e o 99º percentil da latência da solicitação de carga nos últimos dois minutos. | p99: histogram_quantile(0.99, sum by (le) (rate(milvus_querycoord_load_latency_bucket{app_kubernetes_io_instance=~"$instance", app_kubernetes_io_name="$app_name", namespace="$namespace"}[2m]))) avg: sum(increase(milvus_querycoord_load_latency_sum{app_kubernetes_io_instance=~"$instance", app_kubernetes_io_name="$app_name", namespace="$namespace"}[2m])) / sum(increase(milvus_querycoord_load_latency_count{app_kubernetes_io_instance=~"$instance", app_kubernetes_io_name="$app_name", namespace="$namespace"}[2m])) | milvus_querycoord_load_latency | O tempo usado para concluir uma solicitação de carga. |
Latência da solicitação de liberação | A latência média e o percentil 99 da latência da solicitação de liberação nos últimos dois minutos. | p99: histogram_quantile(0.99, sum by (le) (rate(milvus_querycoord_release_latency_bucket{app_kubernetes_io_instance=~"$instance", app_kubernetes_io_name="$app_name", namespace="$namespace"}[2m]))) avg: sum(increase(milvus_querycoord_release_latency_sum{app_kubernetes_io_instance=~"$instance", app_kubernetes_io_name="$app_name", namespace="$namespace"}[2m])) / sum(increase(milvus_querycoord_release_latency_count{app_kubernetes_io_instance=~"$instance", app_kubernetes_io_name="$app_name", namespace="$namespace"}[2m])) | milvus_querycoord_release_latency | O tempo usado para concluir uma solicitação de liberação. |
Tarefa de subcarga | O número de tarefas de subcarga. | sum(milvus_querycoord_child_task_num{app_kubernetes_io_instance=~"$instance", app_kubernetes_io_name="$app_name", namespace="$namespace"}) by (app_kubernetes_io_instance) | milvus_querycoord_child_task_num | O número de tarefas de subcarga. Uma coordenada de consulta divide um pedido de carga em várias subtarefas de carga. |
Tarefa de carga pai | O número de tarefas de carga pai. | sum(milvus_querycoord_parent_task_num{app_kubernetes_io_instance=~"$instance", app_kubernetes_io_name="$app_name", namespace="$namespace"}) by (app_kubernetes_io_instance) | milvus_querycoord_parent_task_num | O número de subtarefas de carga. Cada pedido de carga corresponde a uma tarefa principal na fila de tarefas. |
Latência da tarefa de subcarga | A latência média e o 99º percentil da latência de uma tarefa de subcarga nos últimos dois minutos. | p99: histogram_quantile(0.99, sum by (le) (rate(milvus_querycoord_child_task_latency_bucket{app_kubernetes_io_instance=~"$instance", app_kubernetes_io_name="$app_name", namespace="$namespace"}[2m]))) avg: sum(increase(milvus_querycoord_child_task_latency_sum{app_kubernetes_io_instance=~"$instance", app_kubernetes_io_name="$app_name", namespace="$namespace"}[2m])) / sum(increase(milvus_querycoord_child_task_latency_count{app_kubernetes_io_instance=~"$instance", app_kubernetes_io_name="$app_name", namespace="$namespace"}[2m])) namespace"}[2m]))) | milvus_querycoord_child_task_latency | A latência para concluir uma tarefa de subcarga. |
Número do nó de consulta | O número de nós de consulta geridos pela coordenação de consulta. | sum(milvus_querycoord_querynode_num{app_kubernetes_io_instance=~"$instance", app_kubernetes_io_name="$app_name", namespace="$namespace"}) by (app_kubernetes_io_instance) | milvus_querycoord_querynode_num | O número de nós de consulta geridos pelo coordenador de consultas. |
Nó de consulta
Painel | Descrição do painel | PromQL (linguagem de consulta Prometheus) | As métricas Milvus utilizadas | Descrição das métricas do Milvus |
---|---|---|---|---|
Número de colecções carregadas | O número de colecções carregadas na memória por cada nó de consulta. | sum(milvus_querynode_collection_num{app_kubernetes_io_instance=~"$instance", app_kubernetes_io_name="$app_name", namespace="$namespace"}) by (pod, node_id) | milvus_querynode_collection_num | O número de colecções carregadas por cada nó de consulta. |
Número de partições carregadas | O número de partições carregadas para a memória por cada nó de consulta. | sum(milvus_querynode_partition_num{app_kubernetes_io_instance=~"$instance", app_kubernetes_io_name="$app_name", namespace="$namespace"}) by (pod, node_id) | milvus_querynode_partition_num | O número de partições carregadas por cada nó de consulta. |
Número de segmentos carregados | O número de segmentos carregados na memória por cada nó de consulta. | sum(milvus_querynode_segment_num{app_kubernetes_io_instance=~"$instance", app_kubernetes_io_name="$app_name", namespace="$namespace"}) by (pod, node_id) | milvus_querynode_segment_num | O número de segmentos carregados por cada nó de consulta. |
Número de entidades consultáveis | O número de entidades consultáveis e pesquisáveis em cada nó de consulta. | sum(milvus_querynode_entity_num{app_kubernetes_io_instance=~"$instance", app_kubernetes_io_name="$app_name", namespace="$namespace"}) by (pod, node_id) | milvus_querynode_entity_num | O número de entidades consultáveis e pesquisáveis em cada nó de consulta. |
Canal virtual DML | O número de canais virtuais DML observados por cada nó de consulta. | sum(milvus_querynode_dml_vchannel_num{app_kubernetes_io_instance=~"$instance", app_kubernetes_io_name="$app_name", namespace="$namespace"}) by (pod, node_id) | milvus_querynode_dml_vchannel_num | O número de canais virtuais DML observados por cada nó de consulta. |
Canal virtual delta | O número de canais delta observados por cada nó de consulta. | sum(milvus_querynode_delta_vchannel_num{app_kubernetes_io_instance=~"$instance", app_kubernetes_io_name="$app_name", namespace="$namespace"}) by (pod, node_id) | milvus_querynode_delta_vchannel_num | O número de canais delta observados por cada nó de consulta. |
Número de consumidores | O número de consumidores em cada nó de consulta. | sum(milvus_querynode_consumer_num{app_kubernetes_io_instance=~"$instance", app_kubernetes_io_name="$app_name", namespace="$namespace"}) by (pod, node_id) | milvus_querynode_consumer_num | O número de consumidores em cada nó de consulta. |
Taxa de pedidos de pesquisa | O número total de pedidos de pesquisa e de consulta recebidos por segundo por cada nó de consulta e o número de pedidos de pesquisa e de consulta bem sucedidos nos últimos dois minutos. | sum(increase(milvus_querynode_sq_req_count{app_kubernetes_io_instance=~"$instance", app_kubernetes_io_name="$app_name", namespace="$namespace"}[2m])/120) by (query_type, status, pod, node_id) | milvus_querynode_sq_req_count | O número acumulado de pedidos de pesquisa e consulta. |
Latência dos pedidos de pesquisa | A latência média e o percentil 99 do tempo utilizado nos pedidos de pesquisa e consulta por cada nó de consulta nos últimos dois minutos. Este painel apresenta a latência dos pedidos de pesquisa e consulta cujo estado é "sucesso" ou "total". | p99: histogram_quantile(0.99, sum by (le, pod, node_id) (rate(milvus_querynode_sq_req_latency_bucket{app_kubernetes_io_instance=~"$instance", app_kubernetes_io_name="$app_name", namespace="$namespace"}[2m]))) avg: sum(increase(milvus_querynode_sq_req_latency_sum{app_kubernetes_io_instance=~"$instance", app_kubernetes_io_name="$app_name", namespace="$namespace"}[2m])) by(pod, node_id, query_type) / sum(increase(milvus_querynode_sq_req_latency_count{app_kubernetes_io_instance=~"$instance", app_kubernetes_io_name="$app_name", namespace="$namespace"}[2m])) by(pod, node_id, query_type) | milvus_querynode_sq_req_latency | A latência do pedido de pesquisa do nó de consulta. |
Latência de pesquisa em fila | A latência média e o percentil 99 da latência dos pedidos de pesquisa e consulta em fila nos últimos dois minutos. | p99: histogram_quantile(0.99, sum by (le, pod, node_id, query_type) (rate(milvus_querynode_sq_queue_latency_bucket{app_kubernetes_io_instance=~"$instance", app_kubernetes_io_name="$app_name", namespace="$namespace"}[2m]))) avg: sum(increase(milvus_querynode_sq_queue_latency_sum{app_kubernetes_io_instance=~"$instance", app_kubernetes_io_name="$app_name", namespace="$namespace"}[2m])) by(pod, node_id, query_type) / sum(increase(milvus_querynode_sq_queue_latency_count{app_kubernetes_io_instance=~"$instance", app_kubernetes_io_name="$app_name", namespace="$namespace"}[2m])) by(pod, node_id, query_type) | milvus_querynode_sq_queue_latency | A latência dos pedidos de pesquisa e consulta recebidos pelo nó de consulta. |
Latência do segmento de pesquisa | A latência média e o percentil 99 do tempo que cada nó de consulta leva para pesquisar e consultar um segmento nos últimos dois minutos. O estado de um segmento pode ser selado ou crescente. | p99: histogram_quantile(0.99, sum by (le, query_type, segment_state, pod, node_id) (rate(milvus_querynode_sq_segment_latency_bucket{app_kubernetes_io_instance=~"$instance", app_kubernetes_io_name="$app_name", namespace="$namespace"}[2m]))) avg: sum(increase(milvus_querynode_sq_segment_latency_sum{app_kubernetes_io_instance=~"$instance", app_kubernetes_io_name="$app_name", namespace="$namespace"}[2m])) by(pod, node_id, query_type, segment_state) / sum(increase(milvus_querynode_sq_segment_latency_count{app_kubernetes_io_instance=~"$instance", app_kubernetes_io_name="$app_name", namespace="$namespace"}[2m])) by(pod, node_id, query_type, segment_state) | milvus_querynode_sq_segment_latency | O tempo que cada nó de consulta leva para pesquisar e consultar cada segmento. |
Latência de solicitação do Segcore | A latência média e o percentil 99 do tempo que cada nó de consulta leva para pesquisar e consultar no segcore nos últimos dois minutos. | p99: histogram_quantile(0.99, sum by (le, query_type, pod, node_id) (rate(milvus_querynode_sq_core_latency_bucket{app_kubernetes_io_instance=~"$instance", app_kubernetes_io_name="$app_name", namespace="$namespace"}[2m]))) avg: sum(increase(milvus_querynode_sq_core_latency_sum{app_kubernetes_io_instance=~"$instance", app_kubernetes_io_name="$app_name", namespace="$namespace"}[2m])) by(pod, node_id, query_type) / sum(increase(milvus_querynode_sq_core_latency_count{app_kubernetes_io_instance=~"$instance", app_kubernetes_io_name="$app_name", namespace="$namespace"}[2m])) by(pod, node_id, query_type) | milvus_querynode_sq_core_latency | O tempo que cada nó de consulta leva para pesquisar e consultar no segcore. |
Latência de redução de pesquisa | A latência média e o 99º percentil do tempo usado por cada nó de consulta durante o estágio de redução de uma pesquisa ou consulta nos últimos dois minutos. | p99: histogram_quantile(0.99, sum by (le, pod, node_id, query_type) (rate(milvus_querynode_sq_reduce_latency_bucket{app_kubernetes_io_instance=~"$instance", app_kubernetes_io_name="$app_name", namespace="$namespace"}[2m]))) avg: sum(increase(milvus_querynode_sq_reduce_latency_sum{app_kubernetes_io_instance=~"$instance", app_kubernetes_io_name="$app_name", namespace="$namespace"}[2m])) by(pod, node_id, query_type) / sum(increase(milvus_querynode_sq_reduce_latency_count{app_kubernetes_io_instance=~"$instance", app_kubernetes_io_name="$app_name", namespace="$namespace"}[2m])) by(pod, node_id, query_type) | milvus_querynode_sq_reduce_latency | O tempo que cada consulta gasta durante o estágio de redução. |
Latência do segmento de carga | A latência média e o percentil 99 do tempo que cada nó de consulta leva para carregar um segmento nos últimos dois minutos. | p99: histogram_quantile(0.99, sum by (le, pod, node_id) (rate(milvus_querynode_load_segment_latency_bucket{app_kubernetes_io_instance=~"$instance", app_kubernetes_io_name="$app_name", namespace="$namespace"}[2m]))) avg: sum(increase(milvus_querynode_load_segment_latency_sum{app_kubernetes_io_instance=~"$instance", app_kubernetes_io_name="$app_name", namespace="$namespace"}[2m])) by(pod, node_id) / sum(increase(milvus_querynode_load_segment_latency_count{app_kubernetes_io_instance=~"$instance", app_kubernetes_io_name="$app_name", namespace="$namespace"}[2m])) by(pod, node_id) | milvus_querynode_load_segment_latency_bucket | O tempo que cada nó de consulta leva para carregar um segmento. |
Número do fluxograma | O número de fluxogramas em cada nó de consulta. | sum(milvus_querynode_flowgraph_num{app_kubernetes_io_instance=~"$instance", app_kubernetes_io_name="$app_name", namespace="$namespace"}) by (pod, node_id) | milvus_querynode_flowgraph_num | O número de fluxogramas em cada nó de consulta. |
Comprimento da tarefa de leitura não resolvida | O comprimento da fila de pedidos de leitura não resolvidos em cada nó de consulta. | sum(milvus_querynode_read_task_unsolved_len{app_kubernetes_io_instance=~"$instance", app_kubernetes_io_name="$app_name", namespace="$namespace"}) by (pod, node_id) | milvus_querynode_read_task_unsolved_len | O comprimento da fila de pedidos de leitura não resolvidos. |
Comprimento da tarefa de leitura pronta | O comprimento da fila de pedidos de leitura a serem executados em cada nó de consulta. | sum(milvus_querynode_read_task_ready_len{app_kubernetes_io_instance=~"$instance", app_kubernetes_io_name="$app_name", namespace="$namespace"}) by (pod, node_id) | milvus_querynode_read_task_ready_len | O comprimento da fila de pedidos de leitura a serem executados. |
Número da tarefa de leitura paralela | O número de pedidos de leitura simultâneos executados atualmente em cada nó de consulta. | sum(milvus_querynode_read_task_concurrency{app_kubernetes_io_instance=~"$instance", app_kubernetes_io_name="$app_name", namespace="$namespace"}) by (pod, node_id) | milvus_querynode_read_task_concurrency | O número de solicitações de leitura simultâneas executadas atualmente. |
Estimativa de uso da CPU | A utilização da CPU por cada nó de consulta estimada pelo agendador. | sum(milvus_querynode_estimate_cpu_usage{app_kubernetes_io_instance=~"$instance", app_kubernetes_io_name="$app_name", namespace="$namespace"}) by (pod, node_id) | milvus_querynode_estimate_cpu_usage | A utilização da CPU por cada nó de consulta estimada pelo agendador. Quando o valor é 100, isso significa que uma CPU virtual inteira (vCPU) é usada. |
Tamanho do grupo de pesquisa | O número médio e o percentil 99 do tamanho do grupo de pesquisa (ou seja, o número total de pedidos de pesquisa originais nos pedidos de pesquisa combinados executados por cada nó de consulta) nos últimos dois minutos. | p99: histogram_quantile(0.99, sum by (le, pod, node_id) (rate(milvus_querynode_search_group_size_bucket{app_kubernetes_io_instance=~"$instance", app_kubernetes_io_name="$app_name", namespace="$namespace"}[2m]))) avg: sum(increase(milvus_querynode_search_group_size_sum{app_kubernetes_io_instance=~"$instance", app_kubernetes_io_name="$app_name", namespace="$namespace"}[2m])) by(pod, node_id) / sum(increase(milvus_querynode_search_group_size_count{app_kubernetes_io_instance=~"$instance", app_kubernetes_io_name="$app_name", namespace="$namespace"}[2m])) by(pod, node_id) | milvus_querynode_load_segment_latency_bucket | O número de tarefas de pesquisa originais entre as tarefas de pesquisa combinadas de diferentes compartimentos (ou seja, o tamanho do grupo de pesquisa). |
Pesquisa NQ | O número médio e o percentil 99 do número de consultas (NQ) efectuadas enquanto cada nó de consulta executa pedidos de pesquisa nos últimos dois minutos. | p99: histogram_quantile(0.99, sum by (le, pod, node_id) (rate(milvus_querynode_search_group_size_bucket{app_kubernetes_io_instance=~"$instance", app_kubernetes_io_name="$app_name", namespace="$namespace"}[2m]))) avg: sum(increase(milvus_querynode_search_group_size_sum{app_kubernetes_io_instance=~"$instance", app_kubernetes_io_name="$app_name", namespace="$namespace"}[2m])) by(pod, node_id) / sum(increase(milvus_querynode_search_group_size_count{app_kubernetes_io_instance=~"$instance", app_kubernetes_io_name="$app_name", namespace="$namespace"}[2m])) by(pod, node_id) | milvus_querynode_load_segment_latency_bucket | O número de consultas (NQ) dos pedidos de pesquisa. |
Grupo de pesquisa NQ | O número médio e o percentil 99 do NQ de pedidos de pesquisa combinados e executados por cada nó de consulta nos últimos dois minutos. | p99: histogram_quantile(0.99, sum by (le, pod, node_id) (rate(milvus_querynode_search_group_nq_bucket{app_kubernetes_io_instance=~"$instance", app_kubernetes_io_name="$app_name", namespace="$namespace"}[2m]))) avg: sum(increase(milvus_querynode_search_group_nq_sum{app_kubernetes_io_instance=~"$instance", app_kubernetes_io_name="$app_name", namespace="$namespace"}[2m])) by(pod, node_id) / sum(increase(milvus_querynode_search_group_nq_count{app_kubernetes_io_instance=~"$instance", app_kubernetes_io_name="$app_name", namespace="$namespace"}[2m])) by(pod, node_id) | milvus_querynode_load_segment_latency_bucket | O NQ de solicitações de pesquisa combinadas de diferentes compartimentos. |
Pesquisa Top_K | O número médio e o percentil 99 do Top_K de pedidos de pesquisa executados por cada nó de consulta nos últimos dois minutos. | p99: histogram_quantile(0.99, sum by (le, pod, node_id) (rate(milvus_querynode_search_topk_bucket{app_kubernetes_io_instance=~"$instance", app_kubernetes_io_name="$app_name", namespace="$namespace"}[2m]))) avg: sum(increase(milvus_querynode_search_topk_sum{app_kubernetes_io_instance=~"$instance", app_kubernetes_io_name="$app_name", namespace="$namespace"}[2m])) by(pod, node_id) / sum(increase(milvus_querynode_search_topk_count{app_kubernetes_io_instance=~"$instance", app_kubernetes_io_name="$app_name", namespace="$namespace"}[2m])) by(pod, node_id) | milvus_querynode_load_segment_latency_bucket | O Top_K de pedidos de pesquisa. |
Grupo de pesquisa Top_K | O número médio e o percentil 99 do Top_K de pedidos de pesquisa combinados e executados por cada nó de consulta nos últimos dois minutos. | p99: histogram_quantile(0.99, sum by (le, pod, node_id) (rate(milvus_querynode_search_group_topk_bucket{app_kubernetes_io_instance=~"$instance", app_kubernetes_io_name="$app_name", namespace="$namespace"}[2m]))) avg: sum(increase(milvus_querynode_search_group_topk_sum{app_kubernetes_io_instance=~"$instance", app_kubernetes_io_name="$app_name", namespace="$namespace"}[2m])) by(pod, node_id) / sum(increase(milvus_querynode_search_group_topk_count{app_kubernetes_io_instance=~"$instance", app_kubernetes_io_name="$app_name", namespace="$namespace"}[2m])) by(pod, node_id) | milvus_querynode_load_segment_latency_bucket | O Top_K de solicitações de pesquisa combinadas de diferentes compartimentos. |
Taxa de pedidos de leitura evitados | O número de pedidos de leitura expulsos por segundo por cada nó de consulta nos últimos dois minutos. | sum(increase(milvus_querynode_read_evicted_count{app_kubernetes_io_instance=~"$instance", app_kubernetes_io_name="$app_name", namespace="$namespace"}[2m])/120) by (pod, node_id) | milvus_querynode_sq_req_count | O número acumulado de pedidos de leitura expulsos pelo nó de consulta devido a restrições de tráfego. |
Coordenador de dados
Painel | Descrição do painel | PromQL (linguagem de consulta do Prometheus) | As métricas Milvus utilizadas | Descrição das métricas Milvus |
---|---|---|---|---|
Número do nó de dados | O número de nós de dados geridos pela coordenação de dados. | sum(milvus_datacoord_datanode_num{app_kubernetes_io_instance=~"$instance", app_kubernetes_io_name="$app_name", namespace="$namespace"}) by (app_kubernetes_io_instance) | milvus_datacoord_datanode_num | O número de nós de dados geridos pelo coordenador de dados. |
Número do segmento | O número de todos os tipos de segmentos registados nos metadados pelo coordenador de dados. | sum(milvus_datacoord_segment_num{app_kubernetes_io_instance=~"$instance", app_kubernetes_io_name="$app_name", namespace="$namespace"}) by (segment_state) | milvus_datacoord_segment_num | O número de todos os tipos de segmentos registados nos metadados pelo coordenador de dados. Os tipos de segmentos incluem: descartados, descarregados, descarregados, em crescimento e selados. |
Número da coleção | O número de colecções registadas nos metadados por coordenada de dados. | sum(milvus_datacoord_collection_num{app_kubernetes_io_instance=~"$instance", app_kubernetes_io_name="$app_name", namespace="$namespace"}) by (app_kubernetes_io_instance) | milvus_datacoord_collection_num | O número de colecções registadas nos metadados por coordenada de dados. |
Linhas armazenadas | O número acumulado de linhas de dados válidos e descarregados na coordenada de dados. | sum(milvus_datacoord_stored_rows_num{app_kubernetes_io_instance=~"$instance", app_kubernetes_io_name="$app_name", namespace="$namespace"}) by (app_kubernetes_io_instance) | milvus_datacoord_stored_rows_num | O número acumulado de linhas de dados válidos e descarregados na coordenada de dados. |
Taxa de linhas armazenadas | O número médio de linhas descarregadas por segundo nos últimos dois minutos. | sum(increase(milvus_datacoord_stored_rows_count{app_kubernetes_io_instance=~"$instance", app_kubernetes_io_name="$app_name", namespace="$namespace"}[2m])/120) by (pod, node_id) | milvus_datacoord_stored_rows_count | O número acumulado de linhas descarregadas por coordenada de dados. |
Tempo de sincronização | O número médio, máximo e mínimo de tempo de época sincronizado pela coordenada de dados em cada canal físico. | avg(milvus_datacoord_sync_epoch_time{app_kubernetes_io_instance=~"$instance", app_kubernetes_io_name="$app_name", namespace="$namespace"}) by (app_kubernetes_io_instance) max(milvus_datacoord_sync_epoch_time{app_kubernetes_io_instance=~"$instance", app_kubernetes_io_name="$app_name", namespace="$namespace"}) by (app_kubernetes_io_instance) min(milvus_datacoord_sync_epoch_time{app_kubernetes_io_instance=~"$instance", app_kubernetes_io_name="$app_name", namespace="$namespace"}) by (app_kubernetes_io_instance) | milvus_datacoord_sync_epoch_time | A hora de época de cada canal físico (hora Unix, os milissegundos passados desde 1 de janeiro de 1970). |
Tamanho do Binlog armazenado | O tamanho total do binlog armazenado. | sum(milvus_datacoord_stored_binlog_size{app_kubernetes_io_instance=~"$instance", app_kubernetes_io_name="$app_name", namespace="$namespace"}) by (app_kubernetes_io_instance) | milvus_datacoord_stored_binlog_size | O tamanho total do binlog armazenado no Milvus. |
Nó de dados
Painel | Descrição do painel | PromQL (linguagem de consulta do Prometheus) | As métricas Milvus utilizadas | Descrição da métrica Milvus |
---|---|---|---|---|
Número do fluxograma | O número de objectos do fluxograma que correspondem a cada nó de dados. | sum(milvus_datanode_flowgraph_num{app_kubernetes_io_instance=~"$instance", app_kubernetes_io_name="$app_name", namespace="$namespace"}) by (pod, node_id) | milvus_datanode_flowgraph_num | O número de objectos do fluxograma. Cada fragmento de uma coleção corresponde a um objeto de fluxograma. |
Taxa de consumo de linhas de Msg | O número de linhas de mensagens de fluxo contínuo consumidas por segundo por cada nó de dados nos últimos dois minutos. | sum(increase(milvus_datanode_msg_rows_count{app_kubernetes_io_instance=~"$instance", app_kubernetes_io_name="$app_name", namespace="$namespace"}[2m])/120) by (msg_type, pod, node_id) | milvus_datanode_msg_rows_count | O número de linhas de mensagens de streaming consumidas. Atualmente, as mensagens de streaming contadas por nó de dados apenas incluem mensagens de inserção e eliminação. |
Taxa de tamanho de dados de descarga | O tamanho de cada mensagem de descarga registada por segundo por cada nó de dados nos últimos dois minutos. | sum(increase(milvus_datanode_flushed_data_size{app_kubernetes_io_instance=~"$instance", app_kubernetes_io_name="$app_name", namespace="$namespace"}[2m])/120) by (msg_type, pod, node_id) | milvus_datanode_flushed_data_size | O tamanho de cada mensagem descarregada. Atualmente, as mensagens de streaming contadas por nó de dados apenas incluem mensagens de inserção e eliminação. |
Número de consumidores | O número de consumidores criados em cada nó de dados. | sum(milvus_datanode_consumer_num{app_kubernetes_io_instance=~"$instance", app_kubernetes_io_name="$app_name", namespace="$namespace"}) by (pod, node_id) | milvus_datanode_consumer_num | O número de consumidores criados em cada nó de dados. Cada fluxograma corresponde a um consumidor. |
Produtor Num | O número de produtores criados em cada nó de dados. | sum(milvus_datanode_producer_num{app_kubernetes_io_instance=~"$instance", app_kubernetes_io_name="$app_name", namespace="$namespace"}) by (pod, node_id) | milvus_datanode_producer_num | O número de consumidores criados em cada nó de dados. Cada fragmento em uma coleção corresponde a um produtor de canal delta e um produtor de canal timetick. |
Tempo de sincronização | O número médio, máximo e mínimo de tempo de época sincronizado por cada nó de dados em todos os tópicos físicos. | avg(milvus_datanode_sync_epoch_time{app_kubernetes_io_instance=~"$instance", app_kubernetes_io_name="$app_name", namespace="$namespace"}) by (pod, node_id) max(milvus_datanode_sync_epoch_time{app_kubernetes_io_instance=~"$instance", app_kubernetes_io_name="$app_name", namespace="$namespace"}) by (pod, node_id) min(milvus_datanode_sync_epoch_time{app_kubernetes_io_instance=~"$instance", app_kubernetes_io_name="$app_name", namespace="$namespace"}) by (pod, node_id) | milvus_datanode_sync_epoch_time | A hora de época (hora Unix, os milissegundos passados desde 1 de janeiro de 1970) de cada tópico físico num nó de dados. |
Número do segmento não descarregado | O número de segmentos não descarregados criados em cada nó de dados. | sum(milvus_datanode_unflushed_segment_num{app_kubernetes_io_instance=~"$instance", app_kubernetes_io_name="$app_name", namespace="$namespace"}) by (pod, node_id) | milvus_datanode_unflushed_segment_num | O número de segmentos não descarregados criados em cada nó de dados. |
Latência do buffer de codificação | A latência média e o 99º percentil do tempo usado para codificar um buffer por cada nó de dados nos últimos dois minutos. | p99: histogram_quantile(0.99, sum by (le, pod, node_id) (rate(milvus_datanode_encode_buffer_latency_bucket{app_kubernetes_io_instance=~"$instance", app_kubernetes_io_name="$app_name", namespace="$namespace"}[2m]))) avg: sum(increase(milvus_datanode_encode_buffer_latency_sum{app_kubernetes_io_instance=~"$instance", app_kubernetes_io_name="$app_name", namespace="$namespace"}[2m])) by(pod, node_id) / sum(increase(milvus_datanode_encode_buffer_latency_count{app_kubernetes_io_instance=~"$instance", app_kubernetes_io_name="$app_name", namespace="$namespace"}[2m])) by(pod, node_id) | milvus_datanode_encode_buffer_latency | O tempo que cada nó de dados leva para codificar um buffer. |
Salvar latência de dados | A latência média e o percentil 99 do tempo usado para gravar um buffer na camada de armazenamento por cada nó de dados nos últimos dois minutos. | p99: histogram_quantile(0.99, sum by (le, pod, node_id) (rate(milvus_datanode_save_latency_bucket{app_kubernetes_io_instance=~"$instance", app_kubernetes_io_name="$app_name", namespace="$namespace"}[2m]))) avg: sum(increase(milvus_datanode_save_latency_sum{app_kubernetes_io_instance=~"$instance", app_kubernetes_io_name="$app_name", namespace="$namespace"}[2m])) by(pod, node_id) / sum(increase(milvus_datanode_save_latency_count{app_kubernetes_io_instance=~"$instance", app_kubernetes_io_name="$app_name", namespace="$namespace"}[2m])) by(pod, node_id) | milvus_datanode_save_latency | O tempo que cada nó de dados leva para gravar um buffer na camada de armazenamento. |
Taxa de operação de descarga | O número de vezes que cada nó de dados descarrega um buffer por segundo nos últimos dois minutos. | sum(increase(milvus_datanode_flush_buffer_op_count{app_kubernetes_io_instance=~"$instance", app_kubernetes_io_name="$app_name", namespace="$namespace"}[2m])/120) by (status, pod, node_id) | milvus_datanode_flush_buffer_op_count | O número acumulado de vezes que um nó de dados descarrega um buffer. |
Taxa de operação de autoflush | O número de vezes que cada nó de dados faz a descarga automática de um buffer por segundo nos últimos dois minutos. | sum(increase(milvus_datanode_autoflush_buffer_op_count{app_kubernetes_io_instance=~"$instance", app_kubernetes_io_name="$app_name", namespace="$namespace"}[2m])/120) by (status, pod, node_id) | milvus_datanode_autoflush_buffer_op_count | O número acumulado de vezes que um nó de dados faz a autolimpeza de um buffer. |
Taxa de solicitação de descarga | O número de vezes que cada nó de dados recebe uma solicitação de descarga de buffer por segundo nos últimos dois minutos. | sum(increase(milvus_datanode_flush_req_count{app_kubernetes_io_instance=~"$instance", app_kubernetes_io_name="$app_name", namespace="$namespace"}[2m])/120) by (status, pod, node_id) | milvus_datanode_flush_req_count | O número acumulado de vezes que um nó de dados recebe uma solicitação de descarga de uma coordenada de dados. |
Latência de compactação | A latência média e o percentil 99 do tempo que cada nó de dados leva para executar uma tarefa de compactação nos últimos dois minutos. | p99: histogram_quantile(0.99, sum by (le, pod, node_id) (rate(milvus_datanode_compaction_latency_bucket{app_kubernetes_io_instance=~"$instance", app_kubernetes_io_name="$app_name", namespace="$namespace"}[2m]))) avg: sum(increase(milvus_datanode_compaction_latency_sum{app_kubernetes_io_instance=~"$instance", app_kubernetes_io_name="$app_name", namespace="$namespace"}[2m])) by(pod, node_id) / sum(increase(milvus_datanode_compaction_latency_count{app_kubernetes_io_instance=~"$instance", app_kubernetes_io_name="$app_name", namespace="$namespace"}[2m])) by(pod, node_id) | milvus_datanode_compaction_latency | O tempo que cada nó de dados leva para executar uma tarefa de compactação. |
Coordenador de índices
Painel | Descrição do painel | PromQL (linguagem de consulta Prometheus) | As métricas Milvus utilizadas | Descrição das métricas do Milvus |
---|---|---|---|---|
Taxa de solicitação de índice | O número médio de pedidos de criação de índices recebidos por segundo nos últimos dois minutos. | sum(increase(milvus_indexcoord_indexreq_count{app_kubernetes_io_instance=~"$instance", app_kubernetes_io_name="$app_name", namespace="$namespace"}[2m])/120) by (status) | milvus_indexcoord_indexreq_count | O número de pedidos de criação de índices recebidos. |
Contagem de tarefas de índice | A contagem de todas as tarefas de indexação registadas nos metadados do índice. | sum(milvus_indexcoord_indextask_count{app_kubernetes_io_instance=~"$instance", app_kubernetes_io_name="$app_name", namespace="$namespace"}) by (index_task_status) | milvus_indexcoord_indextask_count | A contagem de todas as tarefas de indexação registadas nos metadados do índice. |
Número do nó de índice | O número de nós de índice geridos. | sum(milvus_indexcoord_indexnode_num{app_kubernetes_io_instance=~"$instance", app_kubernetes_io_name="$app_name", namespace="$namespace"}) by (app_kubernetes_io_instance) | milvus_indexcoord_indexnode_num | O número de nós de índice geridos. |
Nó de índice
Painel | Descrição do painel | PromQL (linguagem de consulta do Prometheus) | As métricas Milvus utilizadas | Descrição das métricas do Milvus |
---|---|---|---|---|
Taxa de tarefas de índice | O número médio de tarefas de criação de índices recebidas por cada nó de índice por segundo nos últimos dois minutos. | sum(increase(milvus_indexnode_index_task_count{app_kubernetes_io_instance=~"$instance", app_kubernetes_io_name="$app_name", namespace="$namespace"}[2m])/120) by (status, pod, node_id) | milvus_indexnode_index_task_count | O número de tarefas de criação de índices recebidas. |
Latência do campo de carga | A latência média e o percentil 99 do tempo utilizado por cada nó de índice para carregar os dados do campo de segmento de cada vez nos últimos dois minutos. | p99: histogram_quantile(0.99, sum by (le, pod, node_id) (rate(milvus_indexnode_load_field_latency_bucket{app_kubernetes_io_instance=~"$instance", app_kubernetes_io_name="$app_name", namespace="$namespace"}[2m]))) avg: sum(increase(milvus_indexnode_load_field_latency_sum{app_kubernetes_io_instance=~"$instance", app_kubernetes_io_name="$app_name", namespace="$namespace"}[2m])) by(pod, node_id) / sum(increase(milvus_indexnode_load_field_latency_count{app_kubernetes_io_instance=~"$instance", app_kubernetes_io_name="$app_name", namespace="$namespace"}[2m])) by(pod, node_id) | milvus_indexnode_load_field_latency | O tempo usado pelo nó de índice para carregar os dados do campo de segmento. |
Latência do campo de descodificação | A latência média e o percentil 99 do tempo utilizado por cada nó de índice para codificar dados de campo de cada vez nos últimos dois minutos. | p99: histogram_quantile(0.99, sum by (le, pod, node_id) (rate(milvus_indexnode_decode_field_latency_bucket{app_kubernetes_io_instance=~"$instance", app_kubernetes_io_name="$app_name", namespace="$namespace"}[2m]))) avg: sum(increase(milvus_indexnode_decode_field_latency_sum{app_kubernetes_io_instance=~"$instance", app_kubernetes_io_name="$app_name", namespace="$namespace"}[2m])) by(pod, node_id) / sum(increase(milvus_indexnode_decode_field_latency_count{app_kubernetes_io_instance=~"$instance", app_kubernetes_io_name="$app_name", namespace="$namespace"}[2m])) by(pod, node_id) | milvus_indexnode_decode_field_latency | O tempo usado para decodificar os dados de campo. |
Latência do índice de construção | A latência média e o percentil 99 do tempo utilizado por cada nó de índice para criar índices nos últimos dois minutos. | p99: histogram_quantile(0.99, sum by (le, pod, node_id) (rate(milvus_indexnode_build_index_latency_bucket{app_kubernetes_io_instance=~"$instance", app_kubernetes_io_name="$app_name", namespace="$namespace"}[2m]))) avg: sum(increase(milvus_indexnode_build_index_latency_sum{app_kubernetes_io_instance=~"$instance", app_kubernetes_io_name="$app_name", namespace="$namespace"}[2m])) by(pod, node_id) / sum(increase(milvus_indexnode_build_index_latency_count{app_kubernetes_io_instance=~"$instance", app_kubernetes_io_name="$app_name", namespace="$namespace"}[2m])) by(pod, node_id) | milvus_indexnode_build_index_latency | O tempo usado para criar índices. |
Codificar a latência do índice | A latência média e o percentil 99 do tempo utilizado por cada nó de índice para codificar ficheiros de índice nos últimos dois minutos. | p99: histogram_quantile(0.99, sum by (le, pod, node_id) (rate(milvus_indexnode_encode_index_latency_bucket{app_kubernetes_io_instance=~"$instance", app_kubernetes_io_name="$app_name", namespace="$namespace"}[2m]))) avg: sum(increase(milvus_indexnode_encode_index_latency_sum{app_kubernetes_io_instance=~"$instance", app_kubernetes_io_name="$app_name", namespace="$namespace"}[2m])) by(pod, node_id) / sum(increase(milvus_indexnode_encode_index_latency_count{app_kubernetes_io_instance=~"$instance", app_kubernetes_io_name="$app_name", namespace="$namespace"}[2m])) by(pod, node_id) | milvus_indexnode_encode_index_latency | O tempo utilizado para codificar ficheiros de índice. |
Guardar a latência do índice | A latência média e o percentil 99 do tempo utilizado por cada nó de índice para guardar ficheiros de índice nos últimos dois minutos. | p99: histogram_quantile(0.99, sum by (le, pod, node_id) (rate(milvus_indexnode_save_index_latency_bucket{app_kubernetes_io_instance=~"$instance", app_kubernetes_io_name="$app_name", namespace="$namespace"}[2m]))) avg: sum(increase(milvus_indexnode_save_index_latency_sum{app_kubernetes_io_instance=~"$instance", app_kubernetes_io_name="$app_name", namespace="$namespace"}[2m])) by(pod, node_id) / sum(increase(milvus_indexnode_save_index_latency_count{app_kubernetes_io_instance=~"$instance", app_kubernetes_io_name="$app_name", namespace="$namespace"}[2m])) by(pod, node_id) | milvus_indexnode_save_index_latency | O tempo utilizado para guardar ficheiros de índice. |