Cruscotto metrico di Milvus
Milvus produce un elenco di metriche dettagliate delle serie temporali durante l'esecuzione. È possibile utilizzare Prometheus e Grafana per visualizzare le metriche. Questo argomento introduce le metriche di monitoraggio visualizzate nella dashboard di Grafana Milvus.
L'unità di tempo in questo argomento è il millisecondo. E "99° percentile" in questo argomento si riferisce al fatto che il 99% delle statistiche di tempo sono controllate entro un certo valore.
Si consiglia di leggere la panoramica del framework di monitoraggio Milvus per comprendere prima le metriche di Prometheus.
Proxy
Pannello | Descrizione del pannello | PromQL (linguaggio di interrogazione di Prometheus) | Le metriche Milvus utilizzate | Descrizione delle metriche Milvus |
---|---|---|---|---|
Tasso di conteggio dei vettori di ricerca | Il numero medio di vettori interrogati al secondo da ciascun proxy negli ultimi due minuti. | sum(increase(milvus_proxy_search_vectors_count{app_kubernetes_io_instance=~"$instance", app_kubernetes_io_name="$app_name", namespace="$namespace"}[2m])/120) by (pod, node_id) | milvus_proxy_search_vectors_count | Il numero accumulato di vettori interrogati. |
Tasso di conteggio dei vettori inseriti | Il numero medio di vettori inseriti al secondo da ciascun proxy negli ultimi due minuti. | sum(increase(milvus_proxy_insert_vectors_count{app_kubernetes_io_instance=~"$instance", app_kubernetes_io_name="$app_name", namespace="$namespace"}[2m])/120) by (pod, node_id) | milvus_proxy_insert_vectors_count | Il numero accumulato di vettori inseriti. |
Latenza di ricerca | La latenza media e il 99° percentile della latenza di ricezione delle richieste di ricerca e di interrogazione da parte di ciascun proxy negli ultimi due minuti. | p99: histogram_quantile(0.99, sum by (le, query_type, pod, node_id) (rate(milvus_proxy_sq_latency_bucket{app_kubernetes_io_instance=~"$instance", app_kubernetes_io_name="$app_name", namespace="$namespace"}[2m]))) avg: sum(increase(milvus_proxy_sq_latency_sum{app_kubernetes_io_instance=~"$instance", app_kubernetes_io_name="$app_name", namespace="$namespace"}[2m])) by (pod, node_id, query_type) / sum(increase(milvus_proxy_sq_latency_count{app_kubernetes_io_instance=~"$instance", app_kubernetes_io_name="$app_name", namespace="$namespace"}[2m])) by (pod, node_id, query_type) | milvus_proxy_sq_latency | La latenza delle richieste di ricerca e di interrogazione. |
Latenza di ricerca della raccolta | La latenza media e il 99° percentile della latenza di ricezione delle richieste di ricerca e di interrogazione di una collezione specifica da parte di ciascun proxy negli ultimi due minuti. | p99: histogram_quantile(0.99, sum by (le, query_type, pod, node_id) (rate(milvus_proxy_collection_sq_latency_bucket{app_kubernetes_io_instance=~"$instance", app_kubernetes_io_name="$app_name", namespace="$namespace", collection_name=~"$collection"}[2m]))) avg: sum(increase(milvus_proxy_collection_sq_latency_sum{app_kubernetes_io_instance=~"$instance", app_kubernetes_io_name="$app_name", namespace="$namespace", collection_name=~"$collection"}[2m])) by (pod, node_id, query_type) / sum(increase(milvus_proxy_collection_sq_latency_count{app_kubernetes_io_instance=~"$instance", app_kubernetes_io_name="$app_name", namespace="$namespace", collection_name=~"$collection"}[2m])) by (pod, node_id, query_type) | milvus_proxy_collection_sq_latency_sum | La latenza delle richieste di ricerca e di interrogazione di una collezione specifica |
Latenza di mutazione | La latenza media e il 99° percentile della latenza di ricezione delle richieste di mutazione da parte di ciascun proxy negli ultimi due minuti. | p99: histogram_quantile(0.99, sum by (le, msg_type, pod, node_id) (rate(milvus_proxy_mutation_latency_bucket{app_kubernetes_io_instance=~"$instance", app_kubernetes_io_name="$app_name", namespace="$namespace"}[2m]))) avg: sum(increase(milvus_proxy_mutation_latency_sum{app_kubernetes_io_instance=~"$instance", app_kubernetes_io_name="$app_name", namespace="$namespace"}[2m])) by (pod, node_id, msg_type) / sum(increase(milvus_proxy_mutation_latency_count{app_kubernetes_io_instance=~"$instance", app_kubernetes_io_name="$app_name", namespace="$namespace"}[2m])) by (pod, node_id, msg_type) | milvus_proxy_mutation_latency_sum | La latenza delle richieste di mutazione. |
Latenza di mutazione della raccolta | La latenza media e il 99° percentile della latenza di ricezione delle richieste di mutazione a una raccolta specifica da parte di ciascun proxy negli ultimi due minuti. | p99: histogram_quantile(0.99, sum by (le, query_type, pod, node_id) (rate(milvus_proxy_collection_sq_latency_bucket{app_kubernetes_io_instance=~"$instance", app_kubernetes_io_name="$app_name", namespace="$namespace", collection_name=~"$collection"}[2m]))) avg: sum(increase(milvus_proxy_collection_sq_latency_sum{app_kubernetes_io_instance=~"$instance", app_kubernetes_io_name="$app_name", namespace="$namespace", collection_name=~"$collection"}[2m])) by (pod, node_id, query_type) / sum(increase(milvus_proxy_collection_sq_latency_count{app_kubernetes_io_instance=~"$instance", app_kubernetes_io_name="$app_name", namespace="$namespace", collection_name=~"$collection"}[2m])) by (pod, node_id, query_type) | milvus_proxy_collection_sq_latency_sum | La latenza delle richieste di mutazione a una raccolta specifica |
Latenza dei risultati della ricerca in attesa | La latenza media e il 99° percentile della latenza tra l'invio di richieste di ricerca e di interrogazione e la ricezione dei risultati da parte dei proxy negli ultimi due minuti. | p99: histogram_quantile(0.99, sum by (le, query_type, pod, node_id) (rate(milvus_proxy_sq_wait_result_latency_bucket{app_kubernetes_io_instance=~"$instance", app_kubernetes_io_name="$app_name", namespace="$namespace"}[2m]))) avg: sum(increase(milvus_proxy_sq_wait_result_latency_sum{app_kubernetes_io_instance=~"$instance", app_kubernetes_io_name="$app_name", namespace="$namespace"}[2m])) by (pod, node_id, query_type) / sum(increase(milvus_proxy_sq_wait_result_latency_count{app_kubernetes_io_instance=~"$instance", app_kubernetes_io_name="$app_name", namespace="$namespace"}[2m])) by (pod, node_id, query_type) | milvus_proxy_sq_wait_result_latency | La latenza tra l'invio di richieste di ricerca e di query e la ricezione dei risultati. |
Ridurre la latenza dei risultati della ricerca | La latenza media e il 99° percentile della latenza dell'aggregazione dei risultati delle ricerche e delle query tramite proxy negli ultimi due minuti. | p99: histogram_quantile(0.99, sum by (le, query_type, pod, node_id) (rate(milvus_proxy_sq_reduce_result_latency_bucket{app_kubernetes_io_instance=~"$instance", app_kubernetes_io_name="$app_name", namespace="$namespace"}[2m]))) avg: sum(increase(milvus_proxy_sq_reduce_result_latency_sum{app_kubernetes_io_instance=~"$instance", app_kubernetes_io_name="$app_name", namespace="$namespace"}[2m])) by (pod, node_id, query_type) / sum(increase(milvus_proxy_sq_reduce_result_latency_count{app_kubernetes_io_instance=~"$instance", app_kubernetes_io_name="$app_name", namespace="$namespace"}[2m])) by (pod, node_id, query_type) | milvus_proxy_sq_reduce_result_latency | La latenza dell'aggregazione dei risultati della ricerca e della query restituiti da ciascun nodo di query. |
Latenza di decodifica dei risultati della ricerca | La latenza media e il 99° percentile della latenza di decodifica dei risultati di ricerca e di query per proxy negli ultimi due minuti. | p99: histogram_quantile(0.99, sum by (le, query_type, pod, node_id) (rate(milvus_proxy_sq_decode_result_latency_bucket{app_kubernetes_io_instance=~"$instance", app_kubernetes_io_name="$app_name", namespace="$namespace"}[2m]))) avg: sum(increase(milvus_proxy_sq_decode_result_latency_sum{app_kubernetes_io_instance=~"$instance", app_kubernetes_io_name="$app_name", namespace="$namespace"}[2m])) by (pod, node_id, query_type) / sum(increase(milvus_proxy_sq_decode_resultlatency_count{app_kubernetes_io_instance=~"$instance", app_kubernetes_io_name="$app_name", namespace="$namespace"}[2m])) by (pod, node_id, query_type) | milvus_proxy_sq_decode_result_latency | La latenza di decodifica di ciascun risultato di ricerca e di query. |
Flusso di messaggi Numero di oggetti | Il numero medio, massimo e minimo di oggetti msgstream creati da ciascun proxy sul tema fisico corrispondente negli ultimi due minuti. | avg(milvus_proxy_msgstream_obj_num{app_kubernetes_io_instance=~"$instance", app_kubernetes_io_name="$app_name", namespace="$namespace"}) by (pod, node_id) max(milvus_proxy_msgstream_obj_num{app_kubernetes_io_instance=~"$instance", app_kubernetes_io_name="$app_name", namespace="$namespace"}) by (pod, node_id) min(milvus_proxy_msgstream_obj_num{app_kubernetes_io_instance=~"$instance", app_kubernetes_io_name="$app_name", namespace="$namespace"}) by (pod, node_id) | milvus_proxy_msgstream_obj_num | Il numero di oggetti msgstream creati su ciascun argomento fisico. |
Latenza di invio della mutazione | La latenza media e il 99° percentile della latenza di invio delle richieste di inserimento o cancellazione da parte di ciascun proxy negli ultimi due minuti. | p99: histogram_quantile(0.99, sum by (le, msg_type, pod, node_id) (rate(milvus_proxy_mutation_send_latency_bucket{app_kubernetes_io_instance=~"$instance", app_kubernetes_io_name="$app_name", namespace="$namespace"}[2m]))) avg: sum(increase(milvus_proxy_mutation_send_latency_sum{app_kubernetes_io_instance=~"$instance", app_kubernetes_io_name="$app_name", namespace="$namespace"}[2m])) by (pod, node_id, msg_type) / sum(increase(milvus_proxy_mutation_send_latency_count{app_kubernetes_io_instance=~"$instance", app_kubernetes_io_name="$app_name", namespace="$namespace"}[2m])) by (pod, node_id, msg_type) | milvus_proxy_mutation_send_latency | La latenza di invio delle richieste di inserimento o cancellazione. |
Tasso di accesso alla cache | Il tasso medio di risposta nella cache delle operazioni che includono GeCollectionID , GetCollectionInfo e GetCollectionSchema al secondo negli ultimi due minuti. | sum(increase(milvus_proxy_cache_hit_count{app_kubernetes_io_instance=~"$instance", app_kubernetes_io_name="$app_name", namespace="$namespace", cache_state="hit"}[2m])/120) by(cache_name, pod, node_id) / sum(increase(milvus_proxy_cache_hit_count{app_kubernetes_io_instance=~"$instance", app_kubernetes_io_name="$app_name", namespace="$namespace"}[2m])/120) by(cache_name, pod, node_id) | milvus_proxy_cache_hit_count | Le statistiche del tasso di successo e di fallimento di ogni operazione di lettura della cache. |
Latenza di aggiornamento della cache | La latenza media e il 99° percentile della latenza di aggiornamento della cache per proxy negli ultimi due minuti. | p99: histogram_quantile(0.99, sum by (le, pod, node_id) (rate(milvus_proxy_cache_update_latency_bucket{app_kubernetes_io_instance=~"$instance", app_kubernetes_io_name="$app_name", namespace="$namespace"}[2m]))) avg: sum(increase(milvus_proxy_cache_update_latency_sum{app_kubernetes_io_instance=~"$instance", app_kubernetes_io_name="$app_name", namespace="$namespace"}[2m])) by (pod, node_id) / sum(increase(milvus_proxy_cache_update_latency_count{app_kubernetes_io_instance=~"$instance", app_kubernetes_io_name="$app_name", namespace="$namespace"}[2m])) by (pod, node_id) | milvus_proxy_cache_update_latency | La latenza di aggiornamento della cache ogni volta. |
Tempo di sincronizzazione | Il numero medio, massimo e minimo di tempi di sincronizzazione di ciascun proxy nel canale fisico corrispondente. | avg(milvus_proxy_sync_epoch_time{app_kubernetes_io_instance=~"$instance", app_kubernetes_io_name="$app_name", namespace="$namespace"}) by (pod, node_id) max(milvus_proxy_sync_epoch_time{app_kubernetes_io_instance=~"$instance", app_kubernetes_io_name="$app_name", namespace="$namespace"}) by (pod, node_id) min(milvus_proxy_sync_epoch_time{app_kubernetes_io_instance=~"$instance", app_kubernetes_io_name="$app_name", namespace="$namespace"}) by (pod, node_id) | milvus_proxy_sync_epoch_time | L'epoch time di ogni canale fisico (tempo Unix, i millisecondi trascorsi dal 1° gennaio 1970). Esiste un ChannelName predefinito, a parte i canali fisici. |
Applicare la latenza PK | La latenza media e il 99° percentile della latenza dell'applicazione della chiave primaria da parte di ciascun proxy negli ultimi due minuti. | p99: histogram_quantile(0.99, sum by (le, pod, node_id) (rate(milvus_proxy_apply_pk_latency_bucket{app_kubernetes_io_instance=~"$instance", app_kubernetes_io_name="$app_name", namespace="$namespace"}[2m]))) avg: sum(increase(milvus_proxy_apply_pk_latency_sum{app_kubernetes_io_instance=~"$instance", app_kubernetes_io_name="$app_name", namespace="$namespace"}[2m])) by (pod, node_id) / sum(increase(milvus_proxy_apply_pk_latency_count{app_kubernetes_io_instance=~"$instance", app_kubernetes_io_name="$app_name", namespace="$namespace"}[2m])) by (pod, node_id) | milvus_proxy_apply_pk_latency | La latenza di applicazione della chiave primaria. |
Latenza di applicazione del timestamp | La latenza media e il 99° percentile della latenza di applicazione del timestamp da parte di ciascun proxy negli ultimi due minuti. | p99: histogram_quantile(0.99, sum by (le, pod, node_id) (rate(milvus_proxy_apply_timestamp_latency_bucket{app_kubernetes_io_instance=~"$instance", app_kubernetes_io_name="$app_name", namespace="$namespace"}[2m]))) avg: sum(increase(milvus_proxy_apply_timestamp_latency_sum{app_kubernetes_io_instance=~"$instance", app_kubernetes_io_name="$app_name", namespace="$namespace"}[2m])) by (pod, node_id) / sum(increase(milvus_proxy_apply_timestamp_latency_count{app_kubernetes_io_instance=~"$instance", app_kubernetes_io_name="$app_name", namespace="$namespace"}[2m])) by (pod, node_id) | milvus_proxy_apply_timestamp_latency | La latenza di applicazione del timestamp. |
Tasso di successo della richiesta | Il numero di richieste ricevute con successo al secondo da ciascun proxy, con una ripartizione dettagliata di ciascun tipo di richiesta. I tipi di richiesta possibili sono DescribeCollection, DescribeIndex, GetCollectionStatistics, HasCollection, Search, Query, ShowPartitions, Insert, ecc. | |||
sum(increase(milvus_proxy_req_count{app_kubernetes_io_instance=~"$instance", app_kubernetes_io_name="$app_name", namespace="$namespace", status="success"}[2m])/120) by(function_name, pod, node_id) | milvus_proxy_req_count | Il numero di tutti i tipi di richieste ricevute | ||
Tasso di richieste non riuscite | Il numero di richieste fallite ricevute al secondo da ciascun proxy, con una ripartizione dettagliata di ciascun tipo di richiesta. I tipi di richiesta possibili sono DescribeCollection, DescribeIndex, GetCollectionStatistics, HasCollection, Search, Query, ShowPartitions, Insert, ecc. | |||
sum(increase(milvus_proxy_req_count{app_kubernetes_io_instance=~"$instance", app_kubernetes_io_name="$app_name", namespace="$namespace", status="fail"}[2m])/120) by(function_name, pod, node_id) | milvus_proxy_req_count | Il numero di tutti i tipi di richieste ricevute | ||
Latenza della richiesta | La latenza media e il 99° percentile della latenza di tutti i tipi di richieste ricevute da ciascun proxy. | p99: histogram_quantile(0.99, sum by (le, pod, node_id, function_name) (rate(milvus_proxy_req_latency_bucket{app_kubernetes_io_instance=~"$instance", app_kubernetes_io_name="$app_name", namespace="$namespace"}[2m]))) avg: sum(increase(milvus_proxy_req_latency_sum{app_kubernetes_io_instance=~"$instance", app_kubernetes_io_name="$app_name", namespace="$namespace"}[2m])) by (pod, node_id, function_name) / sum(increase(milvus_proxy_req_latency_count{app_kubernetes_io_instance=~"$instance", app_kubernetes_io_name="$app_name", namespace="$namespace"}[2m])) by (pod, node_id, function_name) | milvus_proxy_req_latency | La latenza di tutti i tipi di richieste ricevute |
Tasso di byte delle richieste di inserimento/cancellazione | Il numero di byte di richieste di inserimento e cancellazione ricevuti al secondo dal proxy negli ultimi due minuti. | sum(increase(milvus_proxy_receive_bytes_count{app_kubernetes_io_instance=~"$instance", app_kubernetes_io_name="$app_name", namespace="$namespace"}[2m])/120) by(pod, node_id) | milvus_proxy_receive_bytes_count | Il conteggio delle richieste di inserimento e cancellazione. |
Velocità di invio dei byte | Il numero di byte al secondo inviati al client mentre ogni proxy risponde alle richieste di ricerca e di interrogazione negli ultimi due minuti. | sum(increase(milvus_proxy_send_bytes_count{app_kubernetes_io_instance=~"$instance", app_kubernetes_io_name="$app_name", namespace="$namespace"}[2m])/120) by(pod, node_id) | milvus_proxy_send_bytes_count | Il numero di byte inviati al client mentre ogni proxy risponde alle richieste di ricerca e di interrogazione. |
Coordinatore principale
Pannello | Descrizione del pannello | PromQL (linguaggio di interrogazione di Prometheus) | Le metriche Milvus utilizzate | Descrizione delle metriche Milvus |
---|---|---|---|---|
Numero di nodi proxy | Il numero di proxy creati. | sum(milvus_rootcoord_proxy_num{app_kubernetes_io_instance=~"$instance", app_kubernetes_io_name="$app_name", namespace="$namespace"}) by (app_kubernetes_io_instance) | milvus_rootcoord_proxy_num | Il numero di proxy. |
Tempo di sincronizzazione | Il numero medio, massimo e minimo di epoch time sincronizzati da ogni root coord in ogni canale fisico (PChannel). | avg(milvus_rootcoord_sync_epoch_time{app_kubernetes_io_instance=~"$instance", app_kubernetes_io_name="$app_name", namespace="$namespace"}) by (app_kubernetes_io_instance) max(milvus_rootcoord_sync_epoch_time{app_kubernetes_io_instance=~"$instance", app_kubernetes_io_name="$app_name", namespace="$namespace"}) by (app_kubernetes_io_instance) min(milvus_rootcoord_sync_epoch_time{app_kubernetes_io_instance=~"$instance", app_kubernetes_io_name="$app_name", namespace="$namespace"}) by (app_kubernetes_io_instance) | milvus_rootcoord_sync_epoch_time | L'epoch time di ciascun canale fisico (tempo Unix, i millisecondi trascorsi dal 1° gennaio 1970). |
Frequenza delle richieste DDL | Lo stato e il numero di richieste DDL al secondo negli ultimi due minuti. | sum(increase(milvus_rootcoord_ddl_req_count{app_kubernetes_io_instance=~"$instance", app_kubernetes_io_name="$app_name", namespace="$namespace"}[2m])/120) by (status, function_name) | milvus_rootcoord_ddl_req_count | Il numero totale di richieste DDL, compresi CreateCollection , DescribeCollection , DescribeSegments , HasCollection , ShowCollections , ShowPartitions , e ShowSegments . |
Latenza delle richieste DDL | La latenza media e il 99° percentile della latenza delle richieste DDL negli ultimi due minuti. | p99: histogram_quantile(0.99, sum by (le, function_name) (rate(milvus_rootcoord_ddl_req_latency_bucket{app_kubernetes_io_instance=~"$instance", app_kubernetes_io_name="$app_name", namespace="$namespace"}[2m]))) avg: sum(increase(milvus_rootcoord_ddl_req_latency_sum{app_kubernetes_io_instance=~"$instance", app_kubernetes_io_name="$app_name", namespace="$namespace"}[2m])) by (function_name) / sum(increase(milvus_rootcoord_ddl_req_latency_count{app_kubernetes_io_instance=~"$instance", app_kubernetes_io_name="$app_name", namespace="$namespace"}[2m])) by (function_name) | milvus_rootcoord_ddl_req_latency | La latenza di tutti i tipi di richieste DDL. |
Latenza del Timetick di sincronizzazione | La latenza media e il 99° percentile del tempo utilizzato da root coord per sincronizzare tutti i timestamp con PChannel negli ultimi due minuti. | p99: histogram_quantile(0.99, sum by (le) (rate(milvus_rootcoord_sync_timetick_latency_bucket{app_kubernetes_io_instance=~"$instance", app_kubernetes_io_name="$app_name", namespace="$namespace"}[2m]))) avg: sum(increase(milvus_rootcoord_sync_timetick_latency_sum{app_kubernetes_io_instance=~"$instance", app_kubernetes_io_name="$app_name", namespace="$namespace"}[2m])) / sum(increase(milvus_rootcoord_sync_timetick_latency_count{app_kubernetes_io_instance=~"$instance", app_kubernetes_io_name="$app_name", namespace="$namespace"}[2m])) | milvus_rootcoord_sync_timetick_latency | il tempo utilizzato da root coord per sincronizzare tutti i timestamp su pchannel. |
Tasso di assegnazione ID | Il numero di ID assegnati da root coord al secondo negli ultimi due minuti. | sum(increase(milvus_rootcoord_id_alloc_count{app_kubernetes_io_instance=~"$instance", app_kubernetes_io_name="$app_name", namespace="$namespace"}[2m])/120) | milvus_rootcoord_id_alloc_count | Il numero accumulato di ID assegnati da root coord. |
Timestamp | L'ultimo timestamp di root coord. | milvus_rootcoord_timestamp{app_kubernetes_io_instance=~"$instance", app_kubernetes_io_name="$app_name", namespace="$namespace"} | milvus_rootcoord_timestamp | L'ultimo timestamp di root coord. |
Timestamp salvati | I timestamp preassegnati che root coord salva nella meta memoria. | milvus_rootcoord_timestamp_saved{app_kubernetes_io_instance=~"$instance", app_kubernetes_io_name="$app_name", namespace="$namespace"} | milvus_rootcoord_timestamp_saved | I timestamp preassegnati che root coord salva nella meta memoria. I timestamp vengono assegnati 3 secondi prima. Il timestamp viene aggiornato e salvato nel meta storage ogni 50 millisecondi. |
Numero di raccolte | Il numero totale di raccolte. | sum(milvus_rootcoord_collection_num{app_kubernetes_io_instance=~"$instance", app_kubernetes_io_name="$app_name", namespace="$namespace"}) by (app_kubernetes_io_instance) | milvus_rootcoord_collection_num | Il numero totale di raccolte esistenti in Milvus. |
Numero di partizioni | Il numero totale di partizioni. | sum(milvus_rootcoord_partition_num{app_kubernetes_io_instance=~"$instance", app_kubernetes_io_name="$app_name", namespace="$namespace"}) by (app_kubernetes_io_instance) | milvus_rootcoord_partition_num | Il numero totale di partizioni attualmente esistenti in Milvus. |
Numero di canali DML | Il numero totale di canali DML. | sum(milvus_rootcoord_dml_channel_num{app_kubernetes_io_instance=~"$instance", app_kubernetes_io_name="$app_name", namespace="$namespace"}) by (app_kubernetes_io_instance) | milvus_rootcoord_dml_channel_num | Il numero totale di canali DML attualmente esistenti in Milvus. |
Numero di msgstream | Il numero totale di msgstream. | sum(milvus_rootcoord_msgstream_obj_num{app_kubernetes_io_instance=~"$instance", app_kubernetes_io_name="$app_name", namespace="$namespace"}) by (app_kubernetes_io_instance) | milvus_rootcoord_msgstream_obj_num | Il numero totale di msgstream attualmente presenti in Milvus. |
Numero di credenziali | Il numero totale di credenziali. | sum(milvus_rootcoord_credential_num{app_kubernetes_io_instance=~"$instance", app_kubernetes_io_name="$app_name", namespace="$namespace"}) by (app_kubernetes_io_instance) | milvus_rootcoord_credential_num | Il numero totale di credenziali presenti in Milvus. |
Ritardo di spunta | La somma del ritardo massimo dei grafici di flusso su tutti i DataNode e QueryNode. | sum(milvus_rootcoord_time_tick_delay{app_kubernetes_io_instance=~"$instance", app_kubernetes_io_name="$app_name", namespace="$namespace"}) by (app_kubernetes_io_instance) | milvus_rootcoord_time_tick_delay | Il ritardo massimo dei grafici di flusso su ciascun DataNode e QueryNode. |
Coordinatore della query
Pannello | Descrizione del pannello | PromQL (linguaggio di interrogazione di Prometheus) | Le metriche Milvus utilizzate | Descrizione delle metriche Milvus |
---|---|---|---|---|
Numero di raccolte caricate | Il numero di raccolte attualmente caricate in memoria. | sum(milvus_querycoord_collection_num{app_kubernetes_io_instance=~"$instance", app_kubernetes_io_name="$app_name", namespace="$namespace"}) by (app_kubernetes_io_instance) | milvus_querycoord_collection_num | Il numero di raccolte attualmente caricate da Milvus. |
Entità caricate Num | Il numero di entità attualmente caricate in memoria. | sum(milvus_querycoord_entity_num{app_kubernetes_io_instance=~"$instance", app_kubernetes_io_name="$app_name", namespace="$namespace"}) by (app_kubernetes_io_instance) | milvus_querycoord_entitiy_num | Il numero di entità attualmente caricate da Milvus. |
Velocità di richiesta di carico | Il numero di richieste di carico al secondo negli ultimi due minuti. | sum(increase(milvus_querycoord_load_req_count{app_kubernetes_io_instance=~"$instance", app_kubernetes_io_name="$app_name", namespace="$namespace"}[2m])120) by (status) | milvus_querycoord_load_req_count | Il numero accumulato di richieste di carico. |
Tasso di richiesta di rilascio | Il numero di richieste di rilascio al secondo negli ultimi due minuti. | sum(increase(milvus_querycoord_release_req_count{app_kubernetes_io_instance=~"$instance", app_kubernetes_io_name="$app_name", namespace="$namespace"}[2m])/120) by (status) | milvus_querycoord_release_req_count | Il numero accumulato di richieste di rilascio. |
Latenza della richiesta di carico | La latenza media e il 99° percentile della latenza delle richieste di carico negli ultimi due minuti. | p99: histogram_quantile(0.99, sum by (le) (rate(milvus_querycoord_load_latency_bucket{app_kubernetes_io_instance=~"$instance", app_kubernetes_io_name="$app_name", namespace="$namespace"}[2m]))) avg: sum(increase(milvus_querycoord_load_latency_sum{app_kubernetes_io_instance=~"$instance", app_kubernetes_io_name="$app_name", namespace="$namespace"}[2m])) / sum(increase(milvus_querycoord_load_latency_count{app_kubernetes_io_instance=~"$instance", app_kubernetes_io_name="$app_name", namespace="$namespace"}[2m])) | milvus_querycoord_load_latency | Il tempo impiegato per completare una richiesta di carico. |
Latenza della richiesta di rilascio | La latenza media e il 99° percentile della latenza delle richieste di rilascio negli ultimi due minuti. | p99: histogram_quantile(0.99, sum by (le) (rate(milvus_querycoord_release_latency_bucket{app_kubernetes_io_instance=~"$instance", app_kubernetes_io_name="$app_name", namespace="$namespace"}[2m]))) avg: sum(increase(milvus_querycoord_release_latency_sum{app_kubernetes_io_instance=~"$instance", app_kubernetes_io_name="$app_name", namespace="$namespace"}[2m])) / sum(increase(milvus_querycoord_release_latency_count{app_kubernetes_io_instance=~"$instance", app_kubernetes_io_name="$app_name", namespace="$namespace"}[2m])) | milvus_querycoord_release_latency | Il tempo impiegato per completare una richiesta di rilascio. |
Attività di sottocarico | Il numero di task di carico secondari. | sum(milvus_querycoord_child_task_num{app_kubernetes_io_instance=~"$instance", app_kubernetes_io_name="$app_name", namespace="$namespace"}) by (app_kubernetes_io_instance) | milvus_querycoord_child_task_num | Il numero di sottoattività di carico. Una query coord suddivide una richiesta di carico in più sottocompiti di carico. |
Task di carico padre | Il numero di task di carico padre. | sum(milvus_querycoord_parent_task_num{app_kubernetes_io_instance=~"$instance", app_kubernetes_io_name="$app_name", namespace="$namespace"}) by (app_kubernetes_io_instance) | milvus_querycoord_parent_task_num | Il numero di sottocompiti di carico. Ogni richiesta di carico corrisponde a un task padre nella coda dei task. |
Latenza dei sotto-compiti di carico | La latenza media e il 99° percentile della latenza di un'attività di sottocarico negli ultimi due minuti. | p99: histogram_quantile(0.99, sum by (le) (rate(milvus_querycoord_child_task_latency_bucket{app_kubernetes_io_instance=~"$instance", app_kubernetes_io_name="$app_name", namespace="$namespace"}[2m]))) avg: sum(increase(milvus_querycoord_child_task_latency_sum{app_kubernetes_io_instance=~"$instance", app_kubernetes_io_name="$app_name", namespace="$namespace"}[2m])) / sum(increase(milvus_querycoord_child_task_latency_count{app_kubernetes_io_instance=~"$instance", app_kubernetes_io_name="$app_name", namespace="$namespace"}[2m])) namespace"}[2m]))) | milvus_querycoord_child_task_latency | La latenza per completare un'attività di sottocarico. |
Numero di nodi di query | Il numero di nodi di query gestiti da query coord. | sum(milvus_querycoord_querynode_num{app_kubernetes_io_instance=~"$instance", app_kubernetes_io_name="$app_name", namespace="$namespace"}) by (app_kubernetes_io_instance) | milvus_querycoord_querynode_num | Il numero di nodi di query gestiti da query coord. |
Nodo di query
Pannello | Descrizione del pannello | PromQL (linguaggio di interrogazione di Prometheus) | Le metriche Milvus utilizzate | Descrizione delle metriche Milvus |
---|---|---|---|---|
Numero di raccolte caricate | Il numero di raccolte caricate in memoria da ciascun nodo di query. | sum(milvus_querynode_collection_num{app_kubernetes_io_instance=~"$instance", app_kubernetes_io_name="$app_name", namespace="$namespace"}) by (pod, node_id) | milvus_querynode_collection_num | Il numero di raccolte caricate da ciascun nodo di query. |
Partizione caricata Num | Il numero di partizioni caricate in memoria da ciascun nodo di query. | sum(milvus_querynode_partition_num{app_kubernetes_io_instance=~"$instance", app_kubernetes_io_name="$app_name", namespace="$namespace"}) by (pod, node_id) | milvus_querynode_partition_num | Il numero di partizioni caricate da ogni nodo di query. |
Numero di segmenti caricati | Il numero di segmenti caricati in memoria da ogni nodo di query. | sum(milvus_querynode_segment_num{app_kubernetes_io_instance=~"$instance", app_kubernetes_io_name="$app_name", namespace="$namespace"}) by (pod, node_id) | milvus_querynode_segment_num | Il numero di segmenti caricati da ogni nodo di query. |
Entità interrogabili Num | Il numero di entità interrogabili e ricercabili su ogni nodo di query. | sum(milvus_querynode_entity_num{app_kubernetes_io_instance=~"$instance", app_kubernetes_io_name="$app_name", namespace="$namespace"}) by (pod, node_id) | milvus_querynode_entity_num | Il numero di entità interrogabili e ricercabili su ogni nodo di query. |
Canale virtuale DML | Il numero di canali virtuali DML osservati da ogni nodo di query. | sum(milvus_querynode_dml_vchannel_num{app_kubernetes_io_instance=~"$instance", app_kubernetes_io_name="$app_name", namespace="$namespace"}) by (pod, node_id) | milvus_querynode_dml_vchannel_num | Il numero di canali virtuali DML osservati da ogni nodo di query. |
Canale virtuale Delta | Il numero di canali delta osservati da ogni nodo di query. | sum(milvus_querynode_delta_vchannel_num{app_kubernetes_io_instance=~"$instance", app_kubernetes_io_name="$app_name", namespace="$namespace"}) by (pod, node_id) | milvus_querynode_delta_vchannel_num | Il numero di canali delta osservati da ogni nodo di query. |
Numero di consumatori | Il numero di consumatori in ogni nodo di query. | sum(milvus_querynode_consumer_num{app_kubernetes_io_instance=~"$instance", app_kubernetes_io_name="$app_name", namespace="$namespace"}) by (pod, node_id) | milvus_querynode_consumer_num | Il numero di consumatori in ogni nodo di query. |
Tasso di richieste di ricerca | Il numero totale di richieste di ricerca e di query ricevute al secondo da ciascun nodo di query e il numero di richieste di ricerca e di query andate a buon fine negli ultimi due minuti. | sum(increase(milvus_querynode_sq_req_count{app_kubernetes_io_instance=~"$instance", app_kubernetes_io_name="$app_name", namespace="$namespace"}[2m])/120) by (query_type, status, pod, node_id) | milvus_querynode_sq_req_count | Il numero accumulato di richieste di ricerca e di interrogazione. |
Latenza delle richieste di ricerca | La latenza media e il 99° percentile del tempo utilizzato nelle richieste di ricerca e di interrogazione da ciascun nodo di interrogazione negli ultimi due minuti. Questo pannello visualizza la latenza delle richieste di ricerca e di interrogazione il cui stato è "successo" o "totale". | p99: histogram_quantile(0.99, sum by (le, pod, node_id) (rate(milvus_querynode_sq_req_latency_bucket{app_kubernetes_io_instance=~"$instance", app_kubernetes_io_name="$app_name", namespace="$namespace"}[2m]))) avg: sum(increase(milvus_querynode_sq_req_latency_sum{app_kubernetes_io_instance=~"$instance", app_kubernetes_io_name="$app_name", namespace="$namespace"}[2m])) by(pod, node_id, query_type) / sum(increase(milvus_querynode_sq_req_latency_count{app_kubernetes_io_instance=~"$instance", app_kubernetes_io_name="$app_name", namespace="$namespace"}[2m])) by(pod, node_id, query_type) | milvus_querynode_sq_req_latency | La latenza delle richieste di ricerca del nodo di query. |
Latenza della ricerca in coda | La latenza media e il 99° percentile della latenza delle richieste di ricerca e di query in coda negli ultimi due minuti. | p99: histogram_quantile(0.99, sum by (le, pod, node_id, query_type) (rate(milvus_querynode_sq_queue_latency_bucket{app_kubernetes_io_instance=~"$instance", app_kubernetes_io_name="$app_name", namespace="$namespace"}[2m]))) avg: sum(increase(milvus_querynode_sq_queue_latency_sum{app_kubernetes_io_instance=~"$instance", app_kubernetes_io_name="$app_name", namespace="$namespace"}[2m])) by(pod, node_id, query_type) / sum(increase(milvus_querynode_sq_queue_latency_count{app_kubernetes_io_instance=~"$instance", app_kubernetes_io_name="$app_name", namespace="$namespace"}[2m])) by(pod, node_id, query_type) | milvus_querynode_sq_queue_latency | La latenza delle richieste di ricerca e di interrogazione ricevute dal nodo di interrogazione. |
Latenza del segmento di ricerca | La latenza media e il 99° percentile del tempo impiegato da ciascun nodo di query per cercare e interrogare un segmento negli ultimi due minuti. Lo stato di un segmento può essere chiuso o in crescita. | p99: histogram_quantile(0.99, sum by (le, query_type, segment_state, pod, node_id) (rate(milvus_querynode_sq_segment_latency_bucket{app_kubernetes_io_instance=~"$instance", app_kubernetes_io_name="$app_name", namespace="$namespace"}[2m]))) avg: sum(increase(milvus_querynode_sq_segment_latency_sum{app_kubernetes_io_instance=~"$instance", app_kubernetes_io_name="$app_name", namespace="$namespace"}[2m])) by(pod, node_id, query_type, segment_state) / sum(increase(milvus_querynode_sq_segment_latency_count{app_kubernetes_io_instance=~"$instance", app_kubernetes_io_name="$app_name", namespace="$namespace"}[2m])) by(pod, node_id, query_type, segment_state) | milvus_querynode_sq_segment_latency | Tempo impiegato da ciascun nodo di interrogazione per cercare e interrogare ciascun segmento. |
Latenza della richiesta Segcore | La latenza media e il 99° percentile del tempo impiegato da ciascun nodo di interrogazione per cercare e interrogare il segcore negli ultimi due minuti. | p99: histogram_quantile(0.99, sum by (le, query_type, pod, node_id) (rate(milvus_querynode_sq_core_latency_bucket{app_kubernetes_io_instance=~"$instance", app_kubernetes_io_name="$app_name", namespace="$namespace"}[2m]))) avg: sum(increase(milvus_querynode_sq_core_latency_sum{app_kubernetes_io_instance=~"$instance", app_kubernetes_io_name="$app_name", namespace="$namespace"}[2m])) by(pod, node_id, query_type) / sum(increase(milvus_querynode_sq_core_latency_count{app_kubernetes_io_instance=~"$instance", app_kubernetes_io_name="$app_name", namespace="$namespace"}[2m])) by(pod, node_id, query_type) | milvus_querynode_sq_core_latency | Il tempo che ogni nodo di query impiega per cercare e interrogare in segcore. |
Latenza di riduzione della ricerca | La latenza media e il 99° percentile del tempo utilizzato da ciascun nodo di query durante la fase di riduzione di una ricerca o di una query negli ultimi due minuti. | p99: histogram_quantile(0.99, sum by (le, pod, node_id, query_type) (rate(milvus_querynode_sq_reduce_latency_bucket{app_kubernetes_io_instance=~"$instance", app_kubernetes_io_name="$app_name", namespace="$namespace"}[2m]))) avg: sum(increase(milvus_querynode_sq_reduce_latency_sum{app_kubernetes_io_instance=~"$instance", app_kubernetes_io_name="$app_name", namespace="$namespace"}[2m])) by(pod, node_id, query_type) / sum(increase(milvus_querynode_sq_reduce_latency_count{app_kubernetes_io_instance=~"$instance", app_kubernetes_io_name="$app_name", namespace="$namespace"}[2m])) by(pod, node_id, query_type) | milvus_querynode_sq_reduce_latency | Il tempo trascorso da ciascuna query durante la fase di riduzione. |
Latenza del segmento di carico | La latenza media e il 99° percentile del tempo impiegato da ciascun nodo di query per caricare un segmento negli ultimi due minuti. | p99: histogram_quantile(0.99, sum by (le, pod, node_id) (rate(milvus_querynode_load_segment_latency_bucket{app_kubernetes_io_instance=~"$instance", app_kubernetes_io_name="$app_name", namespace="$namespace"}[2m]))) avg: sum(increase(milvus_querynode_load_segment_latency_sum{app_kubernetes_io_instance=~"$instance", app_kubernetes_io_name="$app_name", namespace="$namespace"}[2m])) by(pod, node_id) / sum(increase(milvus_querynode_load_segment_latency_count{app_kubernetes_io_instance=~"$instance", app_kubernetes_io_name="$app_name", namespace="$namespace"}[2m])) by(pod, node_id) | milvus_querynode_load_segment_latency_bucket | Tempo impiegato da ciascun nodo di interrogazione per caricare un segmento. |
Numero di diagrammi di flusso | Il numero di diagrammi di flusso in ogni nodo di query. | sum(milvus_querynode_flowgraph_num{app_kubernetes_io_instance=~"$instance", app_kubernetes_io_name="$app_name", namespace="$namespace"}) by (pod, node_id) | milvus_querynode_flowgraph_num | Il numero di diagrammi di flusso in ogni nodo di query. |
Lunghezza attività di lettura non risolte | La lunghezza della coda di richieste di lettura non risolte in ogni nodo di query. | sum(milvus_querynode_read_task_unsolved_len{app_kubernetes_io_instance=~"$instance", app_kubernetes_io_name="$app_name", namespace="$namespace"}) by (pod, node_id) | milvus_querynode_read_task_unsolved_len | La lunghezza della coda di richieste di lettura non risolte. |
Lunghezza dell'attività di lettura pronta | La lunghezza della coda di richieste di lettura da eseguire in ogni nodo della query. | sum(milvus_querynode_read_task_ready_len{app_kubernetes_io_instance=~"$instance", app_kubernetes_io_name="$app_name", namespace="$namespace"}) by (pod, node_id) | milvus_querynode_read_task_ready_len | La lunghezza della coda di richieste di lettura da eseguire. |
Attività di lettura parallela Num | Il numero di richieste di lettura concorrenti attualmente eseguite in ogni nodo di query. | sum(milvus_querynode_read_task_concurrency{app_kubernetes_io_instance=~"$instance", app_kubernetes_io_name="$app_name", namespace="$namespace"}) by (pod, node_id) | milvus_querynode_read_task_concurrency | Il numero di richieste di lettura concorrenti attualmente in esecuzione. |
Stima dell'uso della CPU | L'utilizzo della CPU da parte di ciascun nodo di query stimato dallo scheduler. | sum(milvus_querynode_estimate_cpu_usage{app_kubernetes_io_instance=~"$instance", app_kubernetes_io_name="$app_name", namespace="$namespace"}) by (pod, node_id) | milvus_querynode_estimate_cpu_usage | L'utilizzo della CPU da parte di ciascun nodo di query stimato dallo scheduler. Se il valore è 100, significa che viene utilizzata un'intera CPU virtuale (vCPU). |
Dimensione del gruppo di ricerca | Il numero medio e il 99° percentile della dimensione del gruppo di ricerca (cioè il numero totale di richieste di ricerca originali nelle richieste di ricerca combinate eseguite da ciascun nodo di query) negli ultimi due minuti. | p99: histogram_quantile(0.99, sum by (le, pod, node_id) (rate(milvus_querynode_search_group_size_bucket{app_kubernetes_io_instance=~"$instance", app_kubernetes_io_name="$app_name", namespace="$namespace"}[2m]))) avg: sum(increase(milvus_querynode_search_group_size_sum{app_kubernetes_io_instance=~"$instance", app_kubernetes_io_name="$app_name", namespace="$namespace"}[2m])) by(pod, node_id) / sum(increase(milvus_querynode_search_group_size_count{app_kubernetes_io_instance=~"$instance", app_kubernetes_io_name="$app_name", namespace="$namespace"}[2m])) by(pod, node_id) | milvus_querynode_load_segment_latency_bucket | Il numero di attività di ricerca originali tra le attività di ricerca combinate di diversi bucket (cioè la dimensione del gruppo di ricerca). |
Ricerca NQ | Il numero medio e il 99° percentile del numero di query (NQ) eseguite da ciascun nodo di ricerca negli ultimi due minuti. | p99: histogram_quantile(0.99, sum by (le, pod, node_id) (rate(milvus_querynode_search_group_size_bucket{app_kubernetes_io_instance=~"$instance", app_kubernetes_io_name="$app_name", namespace="$namespace"}[2m]))) avg: sum(increase(milvus_querynode_search_group_size_sum{app_kubernetes_io_instance=~"$instance", app_kubernetes_io_name="$app_name", namespace="$namespace"}[2m])) by(pod, node_id) / sum(increase(milvus_querynode_search_group_size_count{app_kubernetes_io_instance=~"$instance", app_kubernetes_io_name="$app_name", namespace="$namespace"}[2m])) by(pod, node_id) | milvus_querynode_load_segment_latency_bucket | Il numero di query (NQ) delle richieste di ricerca. |
Gruppo di ricerca NQ | Il numero medio e il 99° percentile di NQ delle richieste di ricerca combinate ed eseguite da ciascun nodo di ricerca negli ultimi due minuti. | p99: histogram_quantile(0.99, sum by (le, pod, node_id) (rate(milvus_querynode_search_group_nq_bucket{app_kubernetes_io_instance=~"$instance", app_kubernetes_io_name="$app_name", namespace="$namespace"}[2m]))) avg: sum(increase(milvus_querynode_search_group_nq_sum{app_kubernetes_io_instance=~"$instance", app_kubernetes_io_name="$app_name", namespace="$namespace"}[2m])) by(pod, node_id) / sum(increase(milvus_querynode_search_group_nq_count{app_kubernetes_io_instance=~"$instance", app_kubernetes_io_name="$app_name", namespace="$namespace"}[2m])) by(pod, node_id) | milvus_querynode_load_segment_latency_bucket | Il QN delle richieste di ricerca combinate da diversi bucket. |
Ricerca Top_K | Il numero medio e il 99° percentile di Top_K delle richieste di ricerca eseguite da ciascun nodo di query negli ultimi due minuti. | p99: histogram_quantile(0.99, sum by (le, pod, node_id) (rate(milvus_querynode_search_topk_bucket{app_kubernetes_io_instance=~"$instance", app_kubernetes_io_name="$app_name", namespace="$namespace"}[2m]))) avg: sum(increase(milvus_querynode_search_topk_sum{app_kubernetes_io_instance=~"$instance", app_kubernetes_io_name="$app_name", namespace="$namespace"}[2m])) by(pod, node_id) / sum(increase(milvus_querynode_search_topk_count{app_kubernetes_io_instance=~"$instance", app_kubernetes_io_name="$app_name", namespace="$namespace"}[2m])) by(pod, node_id) | milvus_querynode_load_segment_latency_bucket | Il Top_K delle richieste di ricerca. |
Gruppo di ricerca Top_K | Il numero medio e il 99° percentile delle Top_K richieste di ricerca combinate ed eseguite da ciascun nodo di query negli ultimi due minuti. | p99: histogram_quantile(0.99, sum by (le, pod, node_id) (rate(milvus_querynode_search_group_topk_bucket{app_kubernetes_io_instance=~"$instance", app_kubernetes_io_name="$app_name", namespace="$namespace"}[2m]))) avg: sum(increase(milvus_querynode_search_group_topk_sum{app_kubernetes_io_instance=~"$instance", app_kubernetes_io_name="$app_name", namespace="$namespace"}[2m])) by(pod, node_id) / sum(increase(milvus_querynode_search_group_topk_count{app_kubernetes_io_instance=~"$instance", app_kubernetes_io_name="$app_name", namespace="$namespace"}[2m])) by(pod, node_id) | milvus_querynode_load_segment_latency_bucket | Top_K delle richieste di ricerca combinate da diversi bucket. |
Tasso di richieste di lettura evase | Il numero di richieste di lettura evase al secondo da ciascun nodo di query negli ultimi due minuti. | sum(increase(milvus_querynode_read_evicted_count{app_kubernetes_io_instance=~"$instance", app_kubernetes_io_name="$app_name", namespace="$namespace"}[2m])/120) by (pod, node_id) | milvus_querynode_sq_req_count | Il numero accumulato di richieste di lettura evase dal nodo di query a causa della limitazione del traffico. |
Coordinatore dei dati
Pannello | Descrizione del pannello | PromQL (linguaggio di interrogazione di Prometheus) | Le metriche Milvus utilizzate | Descrizione delle metriche Milvus |
---|---|---|---|---|
Numero di nodi dati | Il numero di nodi di dati gestiti da Data Coord. | sum(milvus_datacoord_datanode_num{app_kubernetes_io_instance=~"$instance", app_kubernetes_io_name="$app_name", namespace="$namespace"}) by (app_kubernetes_io_instance) | milvus_datacoord_datanode_num | Il numero di nodi dati gestiti da Data Coord. |
Numero di segmenti | Il numero di tutti i tipi di segmenti registrati nei metadati da Data Coord. | sum(milvus_datacoord_segment_num{app_kubernetes_io_instance=~"$instance", app_kubernetes_io_name="$app_name", namespace="$namespace"}) by (segment_state) | milvus_datacoord_segment_num | Il numero di tutti i tipi di segmenti registrati nei metadati da data coord. I tipi di segmenti includono: caduti, scaricati, in fase di flushing, in crescita e sigillati. |
Numero di raccolte | Il numero di raccolte registrate nei metadati per coord. dati. | sum(milvus_datacoord_collection_num{app_kubernetes_io_instance=~"$instance", app_kubernetes_io_name="$app_name", namespace="$namespace"}) by (app_kubernetes_io_instance) | milvus_datacoord_collection_num | Il numero di raccolte registrate nei metadati per coord. dati. |
Righe memorizzate | Il numero accumulato di righe di dati validi e scaricati in data coord. | sum(milvus_datacoord_stored_rows_num{app_kubernetes_io_instance=~"$instance", app_kubernetes_io_name="$app_name", namespace="$namespace"}) by (app_kubernetes_io_instance) | milvus_datacoord_stored_rows_num | Il numero accumulato di righe di dati validi e scaricati nella coord. dati. |
Frequenza delle righe memorizzate | Il numero medio di righe scaricate al secondo negli ultimi due minuti. | sum(increase(milvus_datacoord_stored_rows_count{app_kubernetes_io_instance=~"$instance", app_kubernetes_io_name="$app_name", namespace="$namespace"}[2m])/120) by (pod, node_id) | milvus_datacoord_stored_rows_count | Il numero accumulato di righe scaricate per coord. dati. |
Tempo di sincronizzazione | Il numero medio, massimo e minimo di epoch time sincronizzati da data coord in ciascun canale fisico. | avg(milvus_datacoord_sync_epoch_time{app_kubernetes_io_instance=~"$instance", app_kubernetes_io_name="$app_name", namespace="$namespace"}) by (app_kubernetes_io_instance) max(milvus_datacoord_sync_epoch_time{app_kubernetes_io_instance=~"$instance", app_kubernetes_io_name="$app_name", namespace="$namespace"}) by (app_kubernetes_io_instance) min(milvus_datacoord_sync_epoch_time{app_kubernetes_io_instance=~"$instance", app_kubernetes_io_name="$app_name", namespace="$namespace"}) by (app_kubernetes_io_instance) | milvus_datacoord_sync_epoch_time | L'epoch time di ciascun canale fisico (tempo Unix, i millisecondi trascorsi dal 1° gennaio 1970). |
Dimensione del binlog memorizzato | La dimensione totale del binlog memorizzato. | sum(milvus_datacoord_stored_binlog_size{app_kubernetes_io_instance=~"$instance", app_kubernetes_io_name="$app_name", namespace="$namespace"}) by (app_kubernetes_io_instance) | milvus_datacoord_stored_binlog_size | La dimensione totale del binlog memorizzato in Milvus. |
Nodo dati
Pannello | Descrizione del pannello | PromQL (linguaggio di interrogazione di Prometheus) | Le metriche Milvus utilizzate | Descrizione della metrica Milvus |
---|---|---|---|---|
Numero del diagramma di flusso | Il numero di oggetti del diagramma di flusso che corrispondono a ciascun nodo di dati. | sum(milvus_datanode_flowgraph_num{app_kubernetes_io_instance=~"$instance", app_kubernetes_io_name="$app_name", namespace="$namespace"}) by (pod, node_id) | milvus_datanode_flowgraph_num | Il numero di oggetti del diagramma di flusso. Ogni shard di una collezione corrisponde a un oggetto flowgraph. |
Tasso di consumo di righe di messaggi | Il numero di righe di messaggi in streaming consumate al secondo da ciascun nodo dati negli ultimi due minuti. | sum(increase(milvus_datanode_msg_rows_count{app_kubernetes_io_instance=~"$instance", app_kubernetes_io_name="$app_name", namespace="$namespace"}[2m])/120) by (msg_type, pod, node_id) | milvus_datanode_msg_rows_count | Il numero di righe di messaggi in streaming consumate. Attualmente, i messaggi di streaming contati dal nodo dati includono solo i messaggi di inserimento e cancellazione. |
Tasso di dimensione dei dati di lavaggio | La dimensione di ciascun messaggio di flush registrata al secondo da ciascun nodo dati negli ultimi due minuti. | sum(increase(milvus_datanode_flushed_data_size{app_kubernetes_io_instance=~"$instance", app_kubernetes_io_name="$app_name", namespace="$namespace"}[2m])/120) by (msg_type, pod, node_id) | milvus_datanode_flushed_data_size | La dimensione di ogni messaggio scaricato. Attualmente, i messaggi in streaming contati dal nodo dati includono solo i messaggi di inserimento e cancellazione. |
Numero di consumatori | Il numero di consumatori creati su ciascun nodo dati. | sum(milvus_datanode_consumer_num{app_kubernetes_io_instance=~"$instance", app_kubernetes_io_name="$app_name", namespace="$namespace"}) by (pod, node_id) | milvus_datanode_consumer_num | Il numero di consumatori creati su ogni nodo dati. Ogni flowgraph corrisponde a un consumatore. |
Numero di produttori | Il numero di produttori creati su ogni nodo di dati. | sum(milvus_datanode_producer_num{app_kubernetes_io_instance=~"$instance", app_kubernetes_io_name="$app_name", namespace="$namespace"}) by (pod, node_id) | milvus_datanode_producer_num | Il numero di consumatori creati su ogni nodo di dati. Ogni shard di una collezione corrisponde a un produttore di canali delta e a un produttore di canali timetick. |
Tempo di sincronizzazione | Il numero medio, massimo e minimo di epoch time sincronizzati da ciascun nodo dati in tutti gli argomenti fisici. | avg(milvus_datanode_sync_epoch_time{app_kubernetes_io_instance=~"$instance", app_kubernetes_io_name="$app_name", namespace="$namespace"}) by (pod, node_id) max(milvus_datanode_sync_epoch_time{app_kubernetes_io_instance=~"$instance", app_kubernetes_io_name="$app_name", namespace="$namespace"}) by (pod, node_id) min(milvus_datanode_sync_epoch_time{app_kubernetes_io_instance=~"$instance", app_kubernetes_io_name="$app_name", namespace="$namespace"}) by (pod, node_id) | milvus_datanode_sync_epoch_time | L'epoch time (tempo Unix, i millisecondi trascorsi dal 1° gennaio 1970) di ogni argomento fisico su un nodo dati. |
Numero di segmenti non lavati | Il numero di segmenti non lavati creati su ogni nodo dati. | sum(milvus_datanode_unflushed_segment_num{app_kubernetes_io_instance=~"$instance", app_kubernetes_io_name="$app_name", namespace="$namespace"}) by (pod, node_id) | milvus_datanode_unflushed_segment_num | Il numero di segmenti non lavati creati su ogni nodo dati. |
Latenza del buffer di codifica | La latenza media e il 99° percentile del tempo utilizzato per codificare un buffer da ciascun nodo dati negli ultimi due minuti. | p99: histogram_quantile(0.99, sum by (le, pod, node_id) (rate(milvus_datanode_encode_buffer_latency_bucket{app_kubernetes_io_instance=~"$instance", app_kubernetes_io_name="$app_name", namespace="$namespace"}[2m]))) avg: sum(increase(milvus_datanode_encode_buffer_latency_sum{app_kubernetes_io_instance=~"$instance", app_kubernetes_io_name="$app_name", namespace="$namespace"}[2m])) by(pod, node_id) / sum(increase(milvus_datanode_encode_buffer_latency_count{app_kubernetes_io_instance=~"$instance", app_kubernetes_io_name="$app_name", namespace="$namespace"}[2m])) by(pod, node_id) | milvus_datanode_encode_buffer_latency | Il tempo impiegato da ciascun nodo dati per codificare un buffer. |
Latenza di salvataggio dei dati | La latenza media e il 99° percentile del tempo utilizzato per scrivere un buffer nel livello di archiviazione da ciascun nodo dati negli ultimi due minuti. | p99: histogram_quantile(0.99, sum by (le, pod, node_id) (rate(milvus_datanode_save_latency_bucket{app_kubernetes_io_instance=~"$instance", app_kubernetes_io_name="$app_name", namespace="$namespace"}[2m]))) avg: sum(increase(milvus_datanode_save_latency_sum{app_kubernetes_io_instance=~"$instance", app_kubernetes_io_name="$app_name", namespace="$namespace"}[2m])) by(pod, node_id) / sum(increase(milvus_datanode_save_latency_count{app_kubernetes_io_instance=~"$instance", app_kubernetes_io_name="$app_name", namespace="$namespace"}[2m])) by(pod, node_id) | milvus_datanode_save_latency | Il tempo impiegato da ciascun nodo dati per scrivere un buffer nel livello di archiviazione. |
Frequenza di operazione di lavaggio | Il numero di volte in cui ogni nodo dati esegue il flush di un buffer al secondo negli ultimi due minuti. | sum(increase(milvus_datanode_flush_buffer_op_count{app_kubernetes_io_instance=~"$instance", app_kubernetes_io_name="$app_name", namespace="$namespace"}[2m])/120) by (status, pod, node_id) | milvus_datanode_flush_buffer_op_count | Il numero accumulato di volte in cui un nodo dati esegue il lavaggio di un buffer. |
Frequenza di funzionamento dell'autoflush | Il numero di volte in cui ogni nodo dati esegue il lavaggio automatico di un buffer al secondo negli ultimi due minuti. | sum(increase(milvus_datanode_autoflush_buffer_op_count{app_kubernetes_io_instance=~"$instance", app_kubernetes_io_name="$app_name", namespace="$namespace"}[2m])/120) by (status, pod, node_id) | milvus_datanode_autoflush_buffer_op_count | Il numero accumulato di volte in cui un nodo dati esegue il lavaggio automatico di un buffer. |
Velocità di richiesta di lavaggio | Il numero di volte in cui ogni nodo dati riceve una richiesta di lavaggio del buffer al secondo negli ultimi due minuti. | sum(increase(milvus_datanode_flush_req_count{app_kubernetes_io_instance=~"$instance", app_kubernetes_io_name="$app_name", namespace="$namespace"}[2m])/120) by (status, pod, node_id) | milvus_datanode_flush_req_count | Il numero accumulato di volte in cui un nodo dati riceve una richiesta di lavaggio da un coord. dati. |
Latenza di compattazione | La latenza media e il 99° percentile del tempo impiegato da ciascun nodo dati per eseguire un'attività di compattazione negli ultimi due minuti. | p99: histogram_quantile(0.99, sum by (le, pod, node_id) (rate(milvus_datanode_compaction_latency_bucket{app_kubernetes_io_instance=~"$instance", app_kubernetes_io_name="$app_name", namespace="$namespace"}[2m]))) avg: sum(increase(milvus_datanode_compaction_latency_sum{app_kubernetes_io_instance=~"$instance", app_kubernetes_io_name="$app_name", namespace="$namespace"}[2m])) by(pod, node_id) / sum(increase(milvus_datanode_compaction_latency_count{app_kubernetes_io_instance=~"$instance", app_kubernetes_io_name="$app_name", namespace="$namespace"}[2m])) by(pod, node_id) | milvus_datanode_compaction_latency | Il tempo impiegato da ciascun nodo dati per eseguire un'attività di compattazione. |
Coordinatore dell'indice
Pannello | Descrizione del pannello | PromQL (linguaggio di interrogazione di Prometheus) | Le metriche Milvus utilizzate | Descrizione delle metriche Milvus |
---|---|---|---|---|
Velocità di richiesta dell'indice | Il numero medio di richieste di creazione di indici ricevute al secondo negli ultimi due minuti. | sum(increase(milvus_indexcoord_indexreq_count{app_kubernetes_io_instance=~"$instance", app_kubernetes_io_name="$app_name", namespace="$namespace"}[2m])/120) by (status) | milvus_indexcoord_indexreq_count | Il numero di richieste di costruzione dell'indice ricevute. |
Conteggio delle attività di indicizzazione | Il conteggio di tutte le attività di indicizzazione registrate nei metadati dell'indice. | sum(milvus_indexcoord_indextask_count{app_kubernetes_io_instance=~"$instance", app_kubernetes_io_name="$app_name", namespace="$namespace"}) by (index_task_status) | milvus_indexcoord_indextask_count | Il conteggio di tutte le attività di indicizzazione registrate nei metadati dell'indice. |
Numero di nodi indice | Il numero di nodi indice gestiti. | sum(milvus_indexcoord_indexnode_num{app_kubernetes_io_instance=~"$instance", app_kubernetes_io_name="$app_name", namespace="$namespace"}) by (app_kubernetes_io_instance) | milvus_indexcoord_indexnode_num | Il numero di nodi indice gestiti. |
Nodo indice
Pannello | Descrizione del pannello | PromQL (linguaggio di interrogazione di Prometheus) | Le metriche Milvus utilizzate | Descrizione delle metriche Milvus |
---|---|---|---|---|
Tasso di attività dell'indice | Il numero medio di attività di creazione di indici ricevute da ciascun nodo indice al secondo negli ultimi due minuti. | sum(increase(milvus_indexnode_index_task_count{app_kubernetes_io_instance=~"$instance", app_kubernetes_io_name="$app_name", namespace="$namespace"}[2m])/120) by (status, pod, node_id) | milvus_indexnode_index_task_count | Il numero di task di costruzione dell'indice ricevuti. |
Latenza del campo di carico | La latenza media e il 99° percentile del tempo utilizzato da ciascun nodo indice per caricare i dati del campo del segmento ogni volta negli ultimi due minuti. | p99: histogram_quantile(0.99, sum by (le, pod, node_id) (rate(milvus_indexnode_load_field_latency_bucket{app_kubernetes_io_instance=~"$instance", app_kubernetes_io_name="$app_name", namespace="$namespace"}[2m]))) avg: sum(increase(milvus_indexnode_load_field_latency_sum{app_kubernetes_io_instance=~"$instance", app_kubernetes_io_name="$app_name", namespace="$namespace"}[2m])) by(pod, node_id) / sum(increase(milvus_indexnode_load_field_latency_count{app_kubernetes_io_instance=~"$instance", app_kubernetes_io_name="$app_name", namespace="$namespace"}[2m])) by(pod, node_id) | milvus_indexnode_load_field_latency | Il tempo utilizzato dal nodo indice per caricare i dati del campo segmento. |
Latenza del campo di decodifica | La latenza media e il 99° percentile del tempo utilizzato da ciascun nodo indice per codificare i dati di campo ogni volta negli ultimi due minuti. | p99: histogram_quantile(0.99, sum by (le, pod, node_id) (rate(milvus_indexnode_decode_field_latency_bucket{app_kubernetes_io_instance=~"$instance", app_kubernetes_io_name="$app_name", namespace="$namespace"}[2m]))) avg: sum(increase(milvus_indexnode_decode_field_latency_sum{app_kubernetes_io_instance=~"$instance", app_kubernetes_io_name="$app_name", namespace="$namespace"}[2m])) by(pod, node_id) / sum(increase(milvus_indexnode_decode_field_latency_count{app_kubernetes_io_instance=~"$instance", app_kubernetes_io_name="$app_name", namespace="$namespace"}[2m])) by(pod, node_id) | milvus_indexnode_decode_field_latency | Il tempo utilizzato per decodificare i dati del campo. |
Latenza dell'indice di compilazione | La latenza media e il 99° percentile del tempo utilizzato da ciascun nodo indice per costruire gli indici negli ultimi due minuti. | p99: histogram_quantile(0.99, sum by (le, pod, node_id) (rate(milvus_indexnode_build_index_latency_bucket{app_kubernetes_io_instance=~"$instance", app_kubernetes_io_name="$app_name", namespace="$namespace"}[2m]))) avg: sum(increase(milvus_indexnode_build_index_latency_sum{app_kubernetes_io_instance=~"$instance", app_kubernetes_io_name="$app_name", namespace="$namespace"}[2m])) by(pod, node_id) / sum(increase(milvus_indexnode_build_index_latency_count{app_kubernetes_io_instance=~"$instance", app_kubernetes_io_name="$app_name", namespace="$namespace"}[2m])) by(pod, node_id) | milvus_indexnode_build_index_latency | Il tempo utilizzato per costruire gli indici. |
Latenza dell'indice di codifica | La latenza media e il 99° percentile del tempo utilizzato da ciascun nodo indice per codificare i file indice negli ultimi due minuti. | p99: histogram_quantile(0.99, sum by (le, pod, node_id) (rate(milvus_indexnode_encode_index_latency_bucket{app_kubernetes_io_instance=~"$instance", app_kubernetes_io_name="$app_name", namespace="$namespace"}[2m]))) avg: sum(increase(milvus_indexnode_encode_index_latency_sum{app_kubernetes_io_instance=~"$instance", app_kubernetes_io_name="$app_name", namespace="$namespace"}[2m])) by(pod, node_id) / sum(increase(milvus_indexnode_encode_index_latency_count{app_kubernetes_io_instance=~"$instance", app_kubernetes_io_name="$app_name", namespace="$namespace"}[2m])) by(pod, node_id) | milvus_indexnode_encode_index_latency | Il tempo utilizzato per codificare i file di indice. |
Latenza del salvataggio dell'indice | La latenza media e il 99° percentile del tempo utilizzato da ciascun nodo indice per salvare i file indice negli ultimi due minuti. | p99: histogram_quantile(0.99, sum by (le, pod, node_id) (rate(milvus_indexnode_save_index_latency_bucket{app_kubernetes_io_instance=~"$instance", app_kubernetes_io_name="$app_name", namespace="$namespace"}[2m]))) avg: sum(increase(milvus_indexnode_save_index_latency_sum{app_kubernetes_io_instance=~"$instance", app_kubernetes_io_name="$app_name", namespace="$namespace"}[2m])) by(pod, node_id) / sum(increase(milvus_indexnode_save_index_latency_count{app_kubernetes_io_instance=~"$instance", app_kubernetes_io_name="$app_name", namespace="$namespace"}[2m])) by(pod, node_id) | milvus_indexnode_save_index_latency | Il tempo utilizzato per salvare i file di indice. |