milvus-logo
LFAI
Casa
  • Guida all'amministrazione

Cruscotto metrico di Milvus

Milvus produce un elenco di metriche dettagliate delle serie temporali durante l'esecuzione. È possibile utilizzare Prometheus e Grafana per visualizzare le metriche. Questo argomento introduce le metriche di monitoraggio visualizzate nella dashboard di Grafana Milvus.

L'unità di tempo in questo argomento è il millisecondo. E "99° percentile" in questo argomento si riferisce al fatto che il 99% delle statistiche di tempo sono controllate entro un certo valore.

Si consiglia di leggere la panoramica del framework di monitoraggio Milvus per comprendere prima le metriche di Prometheus.

Proxy

PannelloDescrizione del pannelloPromQL (linguaggio di interrogazione di Prometheus)Le metriche Milvus utilizzateDescrizione delle metriche Milvus
Tasso di conteggio dei vettori di ricercaIl numero medio di vettori interrogati al secondo da ciascun proxy negli ultimi due minuti.sum(increase(milvus_proxy_search_vectors_count{app_kubernetes_io_instance=~"$instance", app_kubernetes_io_name="$app_name", namespace="$namespace"}[2m])/120) by (pod, node_id)milvus_proxy_search_vectors_countIl numero accumulato di vettori interrogati.
Tasso di conteggio dei vettori inseritiIl numero medio di vettori inseriti al secondo da ciascun proxy negli ultimi due minuti.sum(increase(milvus_proxy_insert_vectors_count{app_kubernetes_io_instance=~"$instance", app_kubernetes_io_name="$app_name", namespace="$namespace"}[2m])/120) by (pod, node_id)milvus_proxy_insert_vectors_countIl numero accumulato di vettori inseriti.
Latenza di ricercaLa latenza media e il 99° percentile della latenza di ricezione delle richieste di ricerca e di interrogazione da parte di ciascun proxy negli ultimi due minuti.p99:
histogram_quantile(0.99, sum by (le, query_type, pod, node_id) (rate(milvus_proxy_sq_latency_bucket{app_kubernetes_io_instance=~"$instance", app_kubernetes_io_name="$app_name", namespace="$namespace"}[2m])))
avg:
sum(increase(milvus_proxy_sq_latency_sum{app_kubernetes_io_instance=~"$instance", app_kubernetes_io_name="$app_name", namespace="$namespace"}[2m])) by (pod, node_id, query_type) / sum(increase(milvus_proxy_sq_latency_count{app_kubernetes_io_instance=~"$instance", app_kubernetes_io_name="$app_name", namespace="$namespace"}[2m])) by (pod, node_id, query_type)
milvus_proxy_sq_latencyLa latenza delle richieste di ricerca e di interrogazione.
Latenza di ricerca della raccoltaLa latenza media e il 99° percentile della latenza di ricezione delle richieste di ricerca e di interrogazione di una raccolta specifica da parte di ciascun proxy negli ultimi due minuti.p99:
histogram_quantile(0.99, sum by (le, query_type, pod, node_id) (rate(milvus_proxy_collection_sq_latency_bucket{app_kubernetes_io_instance=~"$instance", app_kubernetes_io_name="$app_name", namespace="$namespace", collection_name=~"$collection"}[2m])))
avg:
sum(increase(milvus_proxy_collection_sq_latency_sum{app_kubernetes_io_instance=~"$instance", app_kubernetes_io_name="$app_name", namespace="$namespace", collection_name=~"$collection"}[2m])) by (pod, node_id, query_type) / sum(increase(milvus_proxy_collection_sq_latency_count{app_kubernetes_io_instance=~"$instance", app_kubernetes_io_name="$app_name", namespace="$namespace", collection_name=~"$collection"}[2m])) by (pod, node_id, query_type)
milvus_proxy_collection_sq_latency_sumLa latenza delle richieste di ricerca e di interrogazione di una collezione specifica
Latenza di mutazioneLa latenza media e il 99° percentile della latenza di ricezione delle richieste di mutazione da parte di ciascun proxy negli ultimi due minuti.p99:
histogram_quantile(0.99, sum by (le, msg_type, pod, node_id) (rate(milvus_proxy_mutation_latency_bucket{app_kubernetes_io_instance=~"$instance", app_kubernetes_io_name="$app_name", namespace="$namespace"}[2m])))
avg:
sum(increase(milvus_proxy_mutation_latency_sum{app_kubernetes_io_instance=~"$instance", app_kubernetes_io_name="$app_name", namespace="$namespace"}[2m])) by (pod, node_id, msg_type) / sum(increase(milvus_proxy_mutation_latency_count{app_kubernetes_io_instance=~"$instance", app_kubernetes_io_name="$app_name", namespace="$namespace"}[2m])) by (pod, node_id, msg_type)
milvus_proxy_mutation_latency_sumLa latenza delle richieste di mutazione.
Latenza di mutazione della raccoltaLa latenza media e il 99° percentile della latenza di ricezione delle richieste di mutazione a una raccolta specifica da parte di ciascun proxy negli ultimi due minuti.p99:
histogram_quantile(0.99, sum by (le, query_type, pod, node_id) (rate(milvus_proxy_collection_sq_latency_bucket{app_kubernetes_io_instance=~"$instance", app_kubernetes_io_name="$app_name", namespace="$namespace", collection_name=~"$collection"}[2m])))
avg:
sum(increase(milvus_proxy_collection_sq_latency_sum{app_kubernetes_io_instance=~"$instance", app_kubernetes_io_name="$app_name", namespace="$namespace", collection_name=~"$collection"}[2m])) by (pod, node_id, query_type) / sum(increase(milvus_proxy_collection_sq_latency_count{app_kubernetes_io_instance=~"$instance", app_kubernetes_io_name="$app_name", namespace="$namespace", collection_name=~"$collection"}[2m])) by (pod, node_id, query_type)
milvus_proxy_collection_sq_latency_sumLa latenza delle richieste di mutazione a una raccolta specifica
Latenza dei risultati della ricerca in attesaLa latenza media e il 99° percentile della latenza tra l'invio di richieste di ricerca e di query e la ricezione dei risultati da parte dei proxy negli ultimi due minuti.p99:
histogram_quantile(0.99, sum by (le, query_type, pod, node_id) (rate(milvus_proxy_sq_wait_result_latency_bucket{app_kubernetes_io_instance=~"$instance", app_kubernetes_io_name="$app_name", namespace="$namespace"}[2m])))
avg:
sum(increase(milvus_proxy_sq_wait_result_latency_sum{app_kubernetes_io_instance=~"$instance", app_kubernetes_io_name="$app_name", namespace="$namespace"}[2m])) by (pod, node_id, query_type) / sum(increase(milvus_proxy_sq_wait_result_latency_count{app_kubernetes_io_instance=~"$instance", app_kubernetes_io_name="$app_name", namespace="$namespace"}[2m])) by (pod, node_id, query_type)
milvus_proxy_sq_wait_result_latencyLa latenza tra l'invio di richieste di ricerca e di query e la ricezione dei risultati.
Ridurre la latenza dei risultati di ricercaLa latenza media e il 99° percentile della latenza dell'aggregazione dei risultati delle ricerche e delle query tramite proxy negli ultimi due minuti.p99:
histogram_quantile(0.99, sum by (le, query_type, pod, node_id) (rate(milvus_proxy_sq_reduce_result_latency_bucket{app_kubernetes_io_instance=~"$instance", app_kubernetes_io_name="$app_name", namespace="$namespace"}[2m])))
avg:
sum(increase(milvus_proxy_sq_reduce_result_latency_sum{app_kubernetes_io_instance=~"$instance", app_kubernetes_io_name="$app_name", namespace="$namespace"}[2m])) by (pod, node_id, query_type) / sum(increase(milvus_proxy_sq_reduce_result_latency_count{app_kubernetes_io_instance=~"$instance", app_kubernetes_io_name="$app_name", namespace="$namespace"}[2m])) by (pod, node_id, query_type)
milvus_proxy_sq_reduce_result_latencyLa latenza dell'aggregazione dei risultati della ricerca e della query restituiti da ciascun nodo di query.
Latenza di decodifica dei risultati della ricercaLa latenza media e il 99° percentile della latenza di decodifica dei risultati di ricerca e di query per proxy negli ultimi due minuti.p99:
histogram_quantile(0.99, sum by (le, query_type, pod, node_id) (rate(milvus_proxy_sq_decode_result_latency_bucket{app_kubernetes_io_instance=~"$instance", app_kubernetes_io_name="$app_name", namespace="$namespace"}[2m])))
avg:
sum(increase(milvus_proxy_sq_decode_result_latency_sum{app_kubernetes_io_instance=~"$instance", app_kubernetes_io_name="$app_name", namespace="$namespace"}[2m])) by (pod, node_id, query_type) / sum(increase(milvus_proxy_sq_decode_resultlatency_count{app_kubernetes_io_instance=~"$instance", app_kubernetes_io_name="$app_name", namespace="$namespace"}[2m])) by (pod, node_id, query_type)
milvus_proxy_sq_decode_result_latencyLa latenza di decodifica di ciascun risultato di ricerca e di query.
Numero di oggetti del flusso di msgIl numero medio, massimo e minimo di oggetti msgstream creati da ciascun proxy sull'argomento fisico corrispondente negli ultimi due minuti.avg(milvus_proxy_msgstream_obj_num{app_kubernetes_io_instance=~"$instance", app_kubernetes_io_name="$app_name", namespace="$namespace"}) by (pod, node_id) max(milvus_proxy_msgstream_obj_num{app_kubernetes_io_instance=~"$instance", app_kubernetes_io_name="$app_name", namespace="$namespace"}) by (pod, node_id) min(milvus_proxy_msgstream_obj_num{app_kubernetes_io_instance=~"$instance", app_kubernetes_io_name="$app_name", namespace="$namespace"}) by (pod, node_id)milvus_proxy_msgstream_obj_numIl numero di oggetti msgstream creati su ciascun argomento fisico.
Latenza di invio delle mutazioniLa latenza media e il 99° percentile della latenza di invio delle richieste di inserimento o cancellazione da parte di ciascun proxy negli ultimi due minuti.p99:
histogram_quantile(0.99, sum by (le, msg_type, pod, node_id) (rate(milvus_proxy_mutation_send_latency_bucket{app_kubernetes_io_instance=~"$instance", app_kubernetes_io_name="$app_name", namespace="$namespace"}[2m])))
avg:
sum(increase(milvus_proxy_mutation_send_latency_sum{app_kubernetes_io_instance=~"$instance", app_kubernetes_io_name="$app_name", namespace="$namespace"}[2m])) by (pod, node_id, msg_type) / sum(increase(milvus_proxy_mutation_send_latency_count{app_kubernetes_io_instance=~"$instance", app_kubernetes_io_name="$app_name", namespace="$namespace"}[2m])) by (pod, node_id, msg_type)
milvus_proxy_mutation_send_latencyLa latenza di invio delle richieste di inserimento o cancellazione.
Tasso di accesso alla cacheIl tasso medio di risposta nella cache delle operazioni che includono GeCollectionID, GetCollectionInfo e GetCollectionSchema al secondo negli ultimi due minuti.sum(increase(milvus_proxy_cache_hit_count{app_kubernetes_io_instance=~"$instance", app_kubernetes_io_name="$app_name", namespace="$namespace", cache_state="hit"}[2m])/120) by(cache_name, pod, node_id) / sum(increase(milvus_proxy_cache_hit_count{app_kubernetes_io_instance=~"$instance", app_kubernetes_io_name="$app_name", namespace="$namespace"}[2m])/120) by(cache_name, pod, node_id)milvus_proxy_cache_hit_countLe statistiche del tasso di successo e di fallimento di ogni operazione di lettura della cache.
Latenza di aggiornamento della cacheLa latenza media e il 99° percentile della latenza di aggiornamento della cache per proxy negli ultimi due minuti.p99:
histogram_quantile(0.99, sum by (le, pod, node_id) (rate(milvus_proxy_cache_update_latency_bucket{app_kubernetes_io_instance=~"$instance", app_kubernetes_io_name="$app_name", namespace="$namespace"}[2m])))
avg:
sum(increase(milvus_proxy_cache_update_latency_sum{app_kubernetes_io_instance=~"$instance", app_kubernetes_io_name="$app_name", namespace="$namespace"}[2m])) by (pod, node_id) / sum(increase(milvus_proxy_cache_update_latency_count{app_kubernetes_io_instance=~"$instance", app_kubernetes_io_name="$app_name", namespace="$namespace"}[2m])) by (pod, node_id)
milvus_proxy_cache_update_latencyLa latenza di aggiornamento della cache ogni volta.
Tempo di sincronizzazioneIl numero medio, massimo e minimo di tempi di sincronizzazione di ciascun proxy nel canale fisico corrispondente.avg(milvus_proxy_sync_epoch_time{app_kubernetes_io_instance=~"$instance", app_kubernetes_io_name="$app_name", namespace="$namespace"}) by (pod, node_id) max(milvus_proxy_sync_epoch_time{app_kubernetes_io_instance=~"$instance", app_kubernetes_io_name="$app_name", namespace="$namespace"}) by (pod, node_id) min(milvus_proxy_sync_epoch_time{app_kubernetes_io_instance=~"$instance", app_kubernetes_io_name="$app_name", namespace="$namespace"}) by (pod, node_id)milvus_proxy_sync_epoch_timeL'epoch time di ogni canale fisico (tempo Unix, i millisecondi trascorsi dal 1° gennaio 1970).
Esiste un ChannelName predefinito, a parte i canali fisici.
Applicare la latenza PKLa latenza media e il 99° percentile della latenza dell'applicazione della chiave primaria da parte di ciascun proxy negli ultimi due minuti.p99:
histogram_quantile(0.99, sum by (le, pod, node_id) (rate(milvus_proxy_apply_pk_latency_bucket{app_kubernetes_io_instance=~"$instance", app_kubernetes_io_name="$app_name", namespace="$namespace"}[2m])))
avg:
sum(increase(milvus_proxy_apply_pk_latency_sum{app_kubernetes_io_instance=~"$instance", app_kubernetes_io_name="$app_name", namespace="$namespace"}[2m])) by (pod, node_id) / sum(increase(milvus_proxy_apply_pk_latency_count{app_kubernetes_io_instance=~"$instance", app_kubernetes_io_name="$app_name", namespace="$namespace"}[2m])) by (pod, node_id)
milvus_proxy_apply_pk_latencyLa latenza di applicazione della chiave primaria.
Latenza di applicazione del timestampLa latenza media e il 99° percentile della latenza di applicazione del timestamp da parte di ciascun proxy negli ultimi due minuti.p99:
histogram_quantile(0.99, sum by (le, pod, node_id) (rate(milvus_proxy_apply_timestamp_latency_bucket{app_kubernetes_io_instance=~"$instance", app_kubernetes_io_name="$app_name", namespace="$namespace"}[2m])))
avg:
sum(increase(milvus_proxy_apply_timestamp_latency_sum{app_kubernetes_io_instance=~"$instance", app_kubernetes_io_name="$app_name", namespace="$namespace"}[2m])) by (pod, node_id) / sum(increase(milvus_proxy_apply_timestamp_latency_count{app_kubernetes_io_instance=~"$instance", app_kubernetes_io_name="$app_name", namespace="$namespace"}[2m])) by (pod, node_id)
milvus_proxy_apply_timestamp_latencyLa latenza di applicazione del timestamp.
Tasso di successo della richiestaIl numero di richieste ricevute con successo al secondo da ciascun proxy, con una ripartizione dettagliata di ciascun tipo di richiesta. I tipi di richiesta possibili sono DescribeCollection, DescribeIndex, GetCollectionStatistics, HasCollection, Search, Query, ShowPartitions, Insert, ecc.
sum(increase(milvus_proxy_req_count{app_kubernetes_io_instance=~"$instance", app_kubernetes_io_name="$app_name", namespace="$namespace", status="success"}[2m])/120) by(function_name, pod, node_id)milvus_proxy_req_countIl numero di tutti i tipi di richieste ricevute
Tasso di richieste non riusciteIl numero di richieste fallite ricevute al secondo da ciascun proxy, con una ripartizione dettagliata di ciascun tipo di richiesta. I tipi di richiesta possibili sono DescribeCollection, DescribeIndex, GetCollectionStatistics, HasCollection, Search, Query, ShowPartitions, Insert, ecc.
sum(increase(milvus_proxy_req_count{app_kubernetes_io_instance=~"$instance", app_kubernetes_io_name="$app_name", namespace="$namespace", status="fail"}[2m])/120) by(function_name, pod, node_id)milvus_proxy_req_countIl numero di tutti i tipi di richieste ricevute
Latenza della richiestaLa latenza media e il 99° percentile della latenza di tutti i tipi di richieste ricevute da ciascun proxy.p99:
histogram_quantile(0.99, sum by (le, pod, node_id, function_name) (rate(milvus_proxy_req_latency_bucket{app_kubernetes_io_instance=~"$instance", app_kubernetes_io_name="$app_name", namespace="$namespace"}[2m])))
avg:
sum(increase(milvus_proxy_req_latency_sum{app_kubernetes_io_instance=~"$instance", app_kubernetes_io_name="$app_name", namespace="$namespace"}[2m])) by (pod, node_id, function_name) / sum(increase(milvus_proxy_req_latency_count{app_kubernetes_io_instance=~"$instance", app_kubernetes_io_name="$app_name", namespace="$namespace"}[2m])) by (pod, node_id, function_name)
milvus_proxy_req_latencyLa latenza di tutti i tipi di richieste ricevute
Tasso di byte delle richieste di inserimento/cancellazioneIl numero di byte di richieste di inserimento e cancellazione ricevuti al secondo dal proxy negli ultimi due minuti.sum(increase(milvus_proxy_receive_bytes_count{app_kubernetes_io_instance=~"$instance", app_kubernetes_io_name="$app_name", namespace="$namespace"}[2m])/120) by(pod, node_id)milvus_proxy_receive_bytes_countIl conteggio delle richieste di inserimento e cancellazione.
Velocità di invio dei byteIl numero di byte al secondo inviati al client mentre ogni proxy risponde alle richieste di ricerca e di interrogazione negli ultimi due minuti.sum(increase(milvus_proxy_send_bytes_count{app_kubernetes_io_instance=~"$instance", app_kubernetes_io_name="$app_name", namespace="$namespace"}[2m])/120) by(pod, node_id)milvus_proxy_send_bytes_countIl numero di byte inviati al client mentre ogni proxy risponde alle richieste di ricerca e di interrogazione.

Coordinatore principale

PannelloDescrizione del pannelloPromQL (linguaggio di interrogazione di Prometheus)Le metriche Milvus utilizzateDescrizione delle metriche Milvus
Numero di nodi proxyIl numero di proxy creati.sum(milvus_rootcoord_proxy_num{app_kubernetes_io_instance=~"$instance", app_kubernetes_io_name="$app_name", namespace="$namespace"}) by (app_kubernetes_io_instance)milvus_rootcoord_proxy_numIl numero di proxy.
Tempo di sincronizzazioneIl numero medio, massimo e minimo di epoch time sincronizzati da ogni root coord in ogni canale fisico (PChannel).avg(milvus_rootcoord_sync_epoch_time{app_kubernetes_io_instance=~"$instance", app_kubernetes_io_name="$app_name", namespace="$namespace"}) by (app_kubernetes_io_instance) max(milvus_rootcoord_sync_epoch_time{app_kubernetes_io_instance=~"$instance", app_kubernetes_io_name="$app_name", namespace="$namespace"}) by (app_kubernetes_io_instance) min(milvus_rootcoord_sync_epoch_time{app_kubernetes_io_instance=~"$instance", app_kubernetes_io_name="$app_name", namespace="$namespace"}) by (app_kubernetes_io_instance)milvus_rootcoord_sync_epoch_timeL'epoch time di ciascun canale fisico (tempo Unix, i millisecondi trascorsi dal 1° gennaio 1970).
Frequenza delle richieste DDLLo stato e il numero di richieste DDL al secondo negli ultimi due minuti.sum(increase(milvus_rootcoord_ddl_req_count{app_kubernetes_io_instance=~"$instance", app_kubernetes_io_name="$app_name", namespace="$namespace"}[2m])/120) by (status, function_name)milvus_rootcoord_ddl_req_countIl numero totale di richieste DDL, compresi CreateCollection, DescribeCollection, DescribeSegments, HasCollection, ShowCollections, ShowPartitions, e ShowSegments.
Latenza delle richieste DDLLa latenza media e il 99° percentile della latenza delle richieste DDL negli ultimi due minuti.p99:
histogram_quantile(0.99, sum by (le, function_name) (rate(milvus_rootcoord_ddl_req_latency_bucket{app_kubernetes_io_instance=~"$instance", app_kubernetes_io_name="$app_name", namespace="$namespace"}[2m])))
avg:
sum(increase(milvus_rootcoord_ddl_req_latency_sum{app_kubernetes_io_instance=~"$instance", app_kubernetes_io_name="$app_name", namespace="$namespace"}[2m])) by (function_name) / sum(increase(milvus_rootcoord_ddl_req_latency_count{app_kubernetes_io_instance=~"$instance", app_kubernetes_io_name="$app_name", namespace="$namespace"}[2m])) by (function_name)
milvus_rootcoord_ddl_req_latencyLa latenza di tutti i tipi di richieste DDL.
Latenza del Timetick di sincronizzazioneLa latenza media e il 99° percentile del tempo utilizzato da root coord per sincronizzare tutti i timestamp con PChannel negli ultimi due minuti.p99:
histogram_quantile(0.99, sum by (le) (rate(milvus_rootcoord_sync_timetick_latency_bucket{app_kubernetes_io_instance=~"$instance", app_kubernetes_io_name="$app_name", namespace="$namespace"}[2m])))
avg:
sum(increase(milvus_rootcoord_sync_timetick_latency_sum{app_kubernetes_io_instance=~"$instance", app_kubernetes_io_name="$app_name", namespace="$namespace"}[2m])) / sum(increase(milvus_rootcoord_sync_timetick_latency_count{app_kubernetes_io_instance=~"$instance", app_kubernetes_io_name="$app_name", namespace="$namespace"}[2m]))
milvus_rootcoord_sync_timetick_latencyil tempo utilizzato da root coord per sincronizzare tutti i timestamp su pchannel.
Tasso di assegnazione IDIl numero di ID assegnati da root coord al secondo negli ultimi due minuti.sum(increase(milvus_rootcoord_id_alloc_count{app_kubernetes_io_instance=~"$instance", app_kubernetes_io_name="$app_name", namespace="$namespace"}[2m])/120)milvus_rootcoord_id_alloc_countIl numero accumulato di ID assegnati da root coord.
TimestampL'ultimo timestamp di root coord.milvus_rootcoord_timestamp{app_kubernetes_io_instance=~"$instance", app_kubernetes_io_name="$app_name", namespace="$namespace"}milvus_rootcoord_timestampL'ultimo timestamp di root coord.
Timestamp salvatiI timestamp preassegnati che root coord salva nella meta memoria.milvus_rootcoord_timestamp_saved{app_kubernetes_io_instance=~"$instance", app_kubernetes_io_name="$app_name", namespace="$namespace"}milvus_rootcoord_timestamp_savedI timestamp preassegnati che root coord salva nella meta memoria.
I timestamp vengono assegnati 3 secondi prima. Il timestamp viene aggiornato e salvato nel meta storage ogni 50 millisecondi.
Numero di raccolteIl numero totale di raccolte.sum(milvus_rootcoord_collection_num{app_kubernetes_io_instance=~"$instance", app_kubernetes_io_name="$app_name", namespace="$namespace"}) by (app_kubernetes_io_instance)milvus_rootcoord_collection_numIl numero totale di raccolte esistenti in Milvus.
Numero di partizioniIl numero totale di partizioni.sum(milvus_rootcoord_partition_num{app_kubernetes_io_instance=~"$instance", app_kubernetes_io_name="$app_name", namespace="$namespace"}) by (app_kubernetes_io_instance)milvus_rootcoord_partition_numIl numero totale di partizioni attualmente esistenti in Milvus.
Numero di canali DMLIl numero totale di canali DML.sum(milvus_rootcoord_dml_channel_num{app_kubernetes_io_instance=~"$instance", app_kubernetes_io_name="$app_name", namespace="$namespace"}) by (app_kubernetes_io_instance)milvus_rootcoord_dml_channel_numIl numero totale di canali DML attualmente esistenti in Milvus.
Numero di msgstreamIl numero totale di msgstream.sum(milvus_rootcoord_msgstream_obj_num{app_kubernetes_io_instance=~"$instance", app_kubernetes_io_name="$app_name", namespace="$namespace"}) by (app_kubernetes_io_instance)milvus_rootcoord_msgstream_obj_numIl numero totale di msgstream attualmente presenti in Milvus.
Numero di credenzialiIl numero totale di credenziali.sum(milvus_rootcoord_credential_num{app_kubernetes_io_instance=~"$instance", app_kubernetes_io_name="$app_name", namespace="$namespace"}) by (app_kubernetes_io_instance)milvus_rootcoord_credential_numIl numero totale di credenziali presenti in Milvus.
Ritardo di spuntaLa somma del ritardo massimo dei grafici di flusso su tutti i DataNode e QueryNode.sum(milvus_rootcoord_time_tick_delay{app_kubernetes_io_instance=~"$instance", app_kubernetes_io_name="$app_name", namespace="$namespace"}) by (app_kubernetes_io_instance)milvus_rootcoord_time_tick_delayIl ritardo massimo dei grafici di flusso su ciascun DataNode e QueryNode.

Coordinatore della query

PannelloDescrizione del pannelloPromQL (linguaggio di interrogazione di Prometheus)Le metriche Milvus utilizzateDescrizione delle metriche Milvus
Numero di raccolte caricateIl numero di raccolte attualmente caricate in memoria.sum(milvus_querycoord_collection_num{app_kubernetes_io_instance=~"$instance", app_kubernetes_io_name="$app_name", namespace="$namespace"}) by (app_kubernetes_io_instance)milvus_querycoord_collection_numIl numero di raccolte attualmente caricate da Milvus.
Entità caricate NumIl numero di entità attualmente caricate in memoria.sum(milvus_querycoord_entity_num{app_kubernetes_io_instance=~"$instance", app_kubernetes_io_name="$app_name", namespace="$namespace"}) by (app_kubernetes_io_instance)milvus_querycoord_entitiy_numIl numero di entità attualmente caricate da Milvus.
Velocità di richiesta di caricoIl numero di richieste di carico al secondo negli ultimi due minuti.sum(increase(milvus_querycoord_load_req_count{app_kubernetes_io_instance=~"$instance", app_kubernetes_io_name="$app_name", namespace="$namespace"}[2m])120) by (status)milvus_querycoord_load_req_countIl numero accumulato di richieste di carico.
Tasso di richiesta di rilascioIl numero di richieste di rilascio al secondo negli ultimi due minuti.sum(increase(milvus_querycoord_release_req_count{app_kubernetes_io_instance=~"$instance", app_kubernetes_io_name="$app_name", namespace="$namespace"}[2m])/120) by (status)milvus_querycoord_release_req_countIl numero accumulato di richieste di rilascio.
Latenza della richiesta di caricoLa latenza media e il 99° percentile della latenza delle richieste di carico negli ultimi due minuti.p99:
histogram_quantile(0.99, sum by (le) (rate(milvus_querycoord_load_latency_bucket{app_kubernetes_io_instance=~"$instance", app_kubernetes_io_name="$app_name", namespace="$namespace"}[2m])))
avg:
sum(increase(milvus_querycoord_load_latency_sum{app_kubernetes_io_instance=~"$instance", app_kubernetes_io_name="$app_name", namespace="$namespace"}[2m])) / sum(increase(milvus_querycoord_load_latency_count{app_kubernetes_io_instance=~"$instance", app_kubernetes_io_name="$app_name", namespace="$namespace"}[2m]))
milvus_querycoord_load_latencyIl tempo impiegato per completare una richiesta di carico.
Latenza della richiesta di rilascioLa latenza media e il 99° percentile della latenza delle richieste di rilascio negli ultimi due minuti.p99:
histogram_quantile(0.99, sum by (le) (rate(milvus_querycoord_release_latency_bucket{app_kubernetes_io_instance=~"$instance", app_kubernetes_io_name="$app_name", namespace="$namespace"}[2m])))
avg:
sum(increase(milvus_querycoord_release_latency_sum{app_kubernetes_io_instance=~"$instance", app_kubernetes_io_name="$app_name", namespace="$namespace"}[2m])) / sum(increase(milvus_querycoord_release_latency_count{app_kubernetes_io_instance=~"$instance", app_kubernetes_io_name="$app_name", namespace="$namespace"}[2m]))
milvus_querycoord_release_latencyIl tempo impiegato per completare una richiesta di rilascio.
Attività di sottocaricoIl numero di task di carico secondari.sum(milvus_querycoord_child_task_num{app_kubernetes_io_instance=~"$instance", app_kubernetes_io_name="$app_name", namespace="$namespace"}) by (app_kubernetes_io_instance)milvus_querycoord_child_task_numIl numero di task di carico secondari.
Una query coord suddivide una richiesta di carico in più sottocompiti di carico.
Task di carico padreIl numero di task di carico padre.sum(milvus_querycoord_parent_task_num{app_kubernetes_io_instance=~"$instance", app_kubernetes_io_name="$app_name", namespace="$namespace"}) by (app_kubernetes_io_instance)milvus_querycoord_parent_task_numIl numero di sottocompiti di carico.
Ogni richiesta di carico corrisponde a un task padre nella coda dei task.
Latenza dei sotto-compiti di caricoLa latenza media e il 99° percentile della latenza di un'attività di sottocarico negli ultimi due minuti.p99:
histogram_quantile(0.99, sum by (le) (rate(milvus_querycoord_child_task_latency_bucket{app_kubernetes_io_instance=~"$instance", app_kubernetes_io_name="$app_name", namespace="$namespace"}[2m])))
avg:
sum(increase(milvus_querycoord_child_task_latency_sum{app_kubernetes_io_instance=~"$instance", app_kubernetes_io_name="$app_name", namespace="$namespace"}[2m])) / sum(increase(milvus_querycoord_child_task_latency_count{app_kubernetes_io_instance=~"$instance", app_kubernetes_io_name="$app_name", namespace="$namespace"}[2m])) namespace"}[2m])))
milvus_querycoord_child_task_latencyLa latenza per completare un'attività di sottocarico.
Numero di nodi di queryIl numero di nodi di query gestiti da query coord.sum(milvus_querycoord_querynode_num{app_kubernetes_io_instance=~"$instance", app_kubernetes_io_name="$app_name", namespace="$namespace"}) by (app_kubernetes_io_instance)milvus_querycoord_querynode_numIl numero di nodi di query gestiti da query coord.

Nodo di query

PannelloDescrizione del pannelloPromQL (linguaggio di interrogazione di Prometheus)Le metriche Milvus utilizzateDescrizione delle metriche Milvus
Numero di raccolte caricateIl numero di raccolte caricate in memoria da ciascun nodo di query.sum(milvus_querynode_collection_num{app_kubernetes_io_instance=~"$instance", app_kubernetes_io_name="$app_name", namespace="$namespace"}) by (pod, node_id)milvus_querynode_collection_numIl numero di raccolte caricate da ciascun nodo di query.
Partizione caricata NumIl numero di partizioni caricate in memoria da ciascun nodo di query.sum(milvus_querynode_partition_num{app_kubernetes_io_instance=~"$instance", app_kubernetes_io_name="$app_name", namespace="$namespace"}) by (pod, node_id)milvus_querynode_partition_numIl numero di partizioni caricate da ogni nodo di query.
Numero di segmenti caricatiIl numero di segmenti caricati in memoria da ogni nodo di query.sum(milvus_querynode_segment_num{app_kubernetes_io_instance=~"$instance", app_kubernetes_io_name="$app_name", namespace="$namespace"}) by (pod, node_id)milvus_querynode_segment_numIl numero di segmenti caricati da ogni nodo di query.
Entità interrogabili NumIl numero di entità interrogabili e ricercabili su ogni nodo di query.sum(milvus_querynode_entity_num{app_kubernetes_io_instance=~"$instance", app_kubernetes_io_name="$app_name", namespace="$namespace"}) by (pod, node_id)milvus_querynode_entity_numIl numero di entità interrogabili e ricercabili su ogni nodo di query.
Canale virtuale DMLIl numero di canali virtuali DML osservati da ogni nodo di query.sum(milvus_querynode_dml_vchannel_num{app_kubernetes_io_instance=~"$instance", app_kubernetes_io_name="$app_name", namespace="$namespace"}) by (pod, node_id)milvus_querynode_dml_vchannel_numIl numero di canali virtuali DML osservati da ogni nodo di query.
Canale virtuale DeltaIl numero di canali delta osservati da ogni nodo di query.sum(milvus_querynode_delta_vchannel_num{app_kubernetes_io_instance=~"$instance", app_kubernetes_io_name="$app_name", namespace="$namespace"}) by (pod, node_id)milvus_querynode_delta_vchannel_numIl numero di canali delta osservati da ogni nodo di query.
Numero di consumatoriIl numero di consumatori in ogni nodo di query.sum(milvus_querynode_consumer_num{app_kubernetes_io_instance=~"$instance", app_kubernetes_io_name="$app_name", namespace="$namespace"}) by (pod, node_id)milvus_querynode_consumer_numIl numero di consumatori in ogni nodo di query.
Tasso di richiesta di ricercaIl numero totale di richieste di ricerca e di query ricevute al secondo da ciascun nodo di query e il numero di richieste di ricerca e di query andate a buon fine negli ultimi due minuti.sum(increase(milvus_querynode_sq_req_count{app_kubernetes_io_instance=~"$instance", app_kubernetes_io_name="$app_name", namespace="$namespace"}[2m])/120) by (query_type, status, pod, node_id)milvus_querynode_sq_req_countIl numero accumulato di richieste di ricerca e di interrogazione.
Latenza delle richieste di ricercaLa latenza media e il 99° percentile del tempo utilizzato nelle richieste di ricerca e di interrogazione da ciascun nodo di interrogazione negli ultimi due minuti.
Questo pannello visualizza la latenza delle richieste di ricerca e di interrogazione il cui stato è "successo" o "totale".
p99:
histogram_quantile(0.99, sum by (le, pod, node_id) (rate(milvus_querynode_sq_req_latency_bucket{app_kubernetes_io_instance=~"$instance", app_kubernetes_io_name="$app_name", namespace="$namespace"}[2m])))
avg:
sum(increase(milvus_querynode_sq_req_latency_sum{app_kubernetes_io_instance=~"$instance", app_kubernetes_io_name="$app_name", namespace="$namespace"}[2m])) by(pod, node_id, query_type) / sum(increase(milvus_querynode_sq_req_latency_count{app_kubernetes_io_instance=~"$instance", app_kubernetes_io_name="$app_name", namespace="$namespace"}[2m])) by(pod, node_id, query_type)
milvus_querynode_sq_req_latencyLa latenza delle richieste di ricerca del nodo di query.
Latenza della ricerca in codaLa latenza media e il 99° percentile della latenza delle richieste di ricerca e di query in coda negli ultimi due minuti.p99:
histogram_quantile(0.99, sum by (le, pod, node_id, query_type) (rate(milvus_querynode_sq_queue_latency_bucket{app_kubernetes_io_instance=~"$instance", app_kubernetes_io_name="$app_name", namespace="$namespace"}[2m])))
avg:
sum(increase(milvus_querynode_sq_queue_latency_sum{app_kubernetes_io_instance=~"$instance", app_kubernetes_io_name="$app_name", namespace="$namespace"}[2m])) by(pod, node_id, query_type) / sum(increase(milvus_querynode_sq_queue_latency_count{app_kubernetes_io_instance=~"$instance", app_kubernetes_io_name="$app_name", namespace="$namespace"}[2m])) by(pod, node_id, query_type)
milvus_querynode_sq_queue_latencyLa latenza delle richieste di ricerca e di interrogazione ricevute dal nodo di interrogazione.
Latenza del segmento di ricercaLa latenza media e il 99° percentile del tempo impiegato da ciascun nodo di query per cercare e interrogare un segmento negli ultimi due minuti.
Lo stato di un segmento può essere chiuso o in crescita.
p99:
histogram_quantile(0.99, sum by (le, query_type, segment_state, pod, node_id) (rate(milvus_querynode_sq_segment_latency_bucket{app_kubernetes_io_instance=~"$instance", app_kubernetes_io_name="$app_name", namespace="$namespace"}[2m])))
avg:
sum(increase(milvus_querynode_sq_segment_latency_sum{app_kubernetes_io_instance=~"$instance", app_kubernetes_io_name="$app_name", namespace="$namespace"}[2m])) by(pod, node_id, query_type, segment_state) / sum(increase(milvus_querynode_sq_segment_latency_count{app_kubernetes_io_instance=~"$instance", app_kubernetes_io_name="$app_name", namespace="$namespace"}[2m])) by(pod, node_id, query_type, segment_state)
milvus_querynode_sq_segment_latencyTempo impiegato da ciascun nodo di interrogazione per cercare e interrogare ciascun segmento.
Latenza della richiesta SegcoreLa latenza media e il 99° percentile del tempo impiegato da ciascun nodo di interrogazione per cercare e interrogare il segcore negli ultimi due minuti.p99:
histogram_quantile(0.99, sum by (le, query_type, pod, node_id) (rate(milvus_querynode_sq_core_latency_bucket{app_kubernetes_io_instance=~"$instance", app_kubernetes_io_name="$app_name", namespace="$namespace"}[2m])))
avg:
sum(increase(milvus_querynode_sq_core_latency_sum{app_kubernetes_io_instance=~"$instance", app_kubernetes_io_name="$app_name", namespace="$namespace"}[2m])) by(pod, node_id, query_type) / sum(increase(milvus_querynode_sq_core_latency_count{app_kubernetes_io_instance=~"$instance", app_kubernetes_io_name="$app_name", namespace="$namespace"}[2m])) by(pod, node_id, query_type)
milvus_querynode_sq_core_latencyIl tempo che ogni nodo di query impiega per cercare e interrogare in segcore.
Latenza di riduzione della ricercaLa latenza media e il 99° percentile del tempo utilizzato da ciascun nodo di query durante la fase di riduzione di una ricerca o di una query negli ultimi due minuti.p99:
histogram_quantile(0.99, sum by (le, pod, node_id, query_type) (rate(milvus_querynode_sq_reduce_latency_bucket{app_kubernetes_io_instance=~"$instance", app_kubernetes_io_name="$app_name", namespace="$namespace"}[2m])))
avg:
sum(increase(milvus_querynode_sq_reduce_latency_sum{app_kubernetes_io_instance=~"$instance", app_kubernetes_io_name="$app_name", namespace="$namespace"}[2m])) by(pod, node_id, query_type) / sum(increase(milvus_querynode_sq_reduce_latency_count{app_kubernetes_io_instance=~"$instance", app_kubernetes_io_name="$app_name", namespace="$namespace"}[2m])) by(pod, node_id, query_type)
milvus_querynode_sq_reduce_latencyIl tempo trascorso da ogni query durante la fase di riduzione.
Latenza del segmento di caricoLa latenza media e il 99° percentile del tempo impiegato da ciascun nodo di query per caricare un segmento negli ultimi due minuti.p99:
histogram_quantile(0.99, sum by (le, pod, node_id) (rate(milvus_querynode_load_segment_latency_bucket{app_kubernetes_io_instance=~"$instance", app_kubernetes_io_name="$app_name", namespace="$namespace"}[2m])))
avg:
sum(increase(milvus_querynode_load_segment_latency_sum{app_kubernetes_io_instance=~"$instance", app_kubernetes_io_name="$app_name", namespace="$namespace"}[2m])) by(pod, node_id) / sum(increase(milvus_querynode_load_segment_latency_count{app_kubernetes_io_instance=~"$instance", app_kubernetes_io_name="$app_name", namespace="$namespace"}[2m])) by(pod, node_id)
milvus_querynode_load_segment_latency_bucketTempo impiegato da ciascun nodo di interrogazione per caricare un segmento.
Numero di diagrammi di flussoIl numero di diagrammi di flusso in ogni nodo di query.sum(milvus_querynode_flowgraph_num{app_kubernetes_io_instance=~"$instance", app_kubernetes_io_name="$app_name", namespace="$namespace"}) by (pod, node_id)milvus_querynode_flowgraph_numIl numero di diagrammi di flusso in ogni nodo di query.
Lunghezza attività di lettura non risolteLa lunghezza della coda di richieste di lettura non risolte in ogni nodo di query.sum(milvus_querynode_read_task_unsolved_len{app_kubernetes_io_instance=~"$instance", app_kubernetes_io_name="$app_name", namespace="$namespace"}) by (pod, node_id)milvus_querynode_read_task_unsolved_lenLa lunghezza della coda di richieste di lettura non risolte.
Lunghezza dell'attività di lettura prontaLa lunghezza della coda di richieste di lettura da eseguire in ogni nodo della query.sum(milvus_querynode_read_task_ready_len{app_kubernetes_io_instance=~"$instance", app_kubernetes_io_name="$app_name", namespace="$namespace"}) by (pod, node_id)milvus_querynode_read_task_ready_lenLa lunghezza della coda di richieste di lettura da eseguire.
Attività di lettura parallela NumIl numero di richieste di lettura concorrenti attualmente eseguite in ogni nodo di query.sum(milvus_querynode_read_task_concurrency{app_kubernetes_io_instance=~"$instance", app_kubernetes_io_name="$app_name", namespace="$namespace"}) by (pod, node_id)milvus_querynode_read_task_concurrencyIl numero di richieste di lettura concorrenti attualmente in esecuzione.
Stima dell'uso della CPUL'utilizzo della CPU da parte di ciascun nodo di query stimato dallo scheduler.sum(milvus_querynode_estimate_cpu_usage{app_kubernetes_io_instance=~"$instance", app_kubernetes_io_name="$app_name", namespace="$namespace"}) by (pod, node_id)milvus_querynode_estimate_cpu_usageL'utilizzo della CPU da parte di ciascun nodo di query stimato dallo scheduler.
Se il valore è 100, significa che viene utilizzata un'intera CPU virtuale (vCPU).
Dimensione del gruppo di ricercaIl numero medio e il 99° percentile della dimensione del gruppo di ricerca (cioè il numero totale di richieste di ricerca originali nelle richieste di ricerca combinate eseguite da ciascun nodo di query) negli ultimi due minuti.p99:
histogram_quantile(0.99, sum by (le, pod, node_id) (rate(milvus_querynode_search_group_size_bucket{app_kubernetes_io_instance=~"$instance", app_kubernetes_io_name="$app_name", namespace="$namespace"}[2m])))
avg:
sum(increase(milvus_querynode_search_group_size_sum{app_kubernetes_io_instance=~"$instance", app_kubernetes_io_name="$app_name", namespace="$namespace"}[2m])) by(pod, node_id) / sum(increase(milvus_querynode_search_group_size_count{app_kubernetes_io_instance=~"$instance", app_kubernetes_io_name="$app_name", namespace="$namespace"}[2m])) by(pod, node_id)
milvus_querynode_load_segment_latency_bucketIl numero di attività di ricerca originali tra le attività di ricerca combinate di diversi bucket (ovvero la dimensione del gruppo di ricerca).
Ricerca NQIl numero medio e il 99° percentile del numero di query (NQ) eseguite da ciascun nodo di ricerca negli ultimi due minuti.p99:
histogram_quantile(0.99, sum by (le, pod, node_id) (rate(milvus_querynode_search_group_size_bucket{app_kubernetes_io_instance=~"$instance", app_kubernetes_io_name="$app_name", namespace="$namespace"}[2m])))
avg:
sum(increase(milvus_querynode_search_group_size_sum{app_kubernetes_io_instance=~"$instance", app_kubernetes_io_name="$app_name", namespace="$namespace"}[2m])) by(pod, node_id) / sum(increase(milvus_querynode_search_group_size_count{app_kubernetes_io_instance=~"$instance", app_kubernetes_io_name="$app_name", namespace="$namespace"}[2m])) by(pod, node_id)
milvus_querynode_load_segment_latency_bucketIl numero di query (NQ) delle richieste di ricerca.
Gruppo di ricerca NQIl numero medio e il 99° percentile di NQ delle richieste di ricerca combinate ed eseguite da ciascun nodo di ricerca negli ultimi due minuti.p99:
histogram_quantile(0.99, sum by (le, pod, node_id) (rate(milvus_querynode_search_group_nq_bucket{app_kubernetes_io_instance=~"$instance", app_kubernetes_io_name="$app_name", namespace="$namespace"}[2m])))
avg:
sum(increase(milvus_querynode_search_group_nq_sum{app_kubernetes_io_instance=~"$instance", app_kubernetes_io_name="$app_name", namespace="$namespace"}[2m])) by(pod, node_id) / sum(increase(milvus_querynode_search_group_nq_count{app_kubernetes_io_instance=~"$instance", app_kubernetes_io_name="$app_name", namespace="$namespace"}[2m])) by(pod, node_id)
milvus_querynode_load_segment_latency_bucketIl QN delle richieste di ricerca combinate da diversi bucket.
Ricerca Top_KIl numero medio e il 99° percentile di Top_K delle richieste di ricerca eseguite da ciascun nodo di query negli ultimi due minuti.p99:
histogram_quantile(0.99, sum by (le, pod, node_id) (rate(milvus_querynode_search_topk_bucket{app_kubernetes_io_instance=~"$instance", app_kubernetes_io_name="$app_name", namespace="$namespace"}[2m])))
avg:
sum(increase(milvus_querynode_search_topk_sum{app_kubernetes_io_instance=~"$instance", app_kubernetes_io_name="$app_name", namespace="$namespace"}[2m])) by(pod, node_id) / sum(increase(milvus_querynode_search_topk_count{app_kubernetes_io_instance=~"$instance", app_kubernetes_io_name="$app_name", namespace="$namespace"}[2m])) by(pod, node_id)
milvus_querynode_load_segment_latency_bucketIl Top_K delle richieste di ricerca.
Gruppo di ricerca Top_KIl numero medio e il 99° percentile delle Top_K richieste di ricerca combinate ed eseguite da ciascun nodo di query negli ultimi due minuti.p99:
histogram_quantile(0.99, sum by (le, pod, node_id) (rate(milvus_querynode_search_group_topk_bucket{app_kubernetes_io_instance=~"$instance", app_kubernetes_io_name="$app_name", namespace="$namespace"}[2m])))
avg:
sum(increase(milvus_querynode_search_group_topk_sum{app_kubernetes_io_instance=~"$instance", app_kubernetes_io_name="$app_name", namespace="$namespace"}[2m])) by(pod, node_id) / sum(increase(milvus_querynode_search_group_topk_count{app_kubernetes_io_instance=~"$instance", app_kubernetes_io_name="$app_name", namespace="$namespace"}[2m])) by(pod, node_id)
milvus_querynode_load_segment_latency_bucketTop_K delle richieste di ricerca combinate da diversi bucket.
Tasso di richieste di lettura evaseIl numero di richieste di lettura evase al secondo da ciascun nodo di query negli ultimi due minuti.sum(increase(milvus_querynode_read_evicted_count{app_kubernetes_io_instance=~"$instance", app_kubernetes_io_name="$app_name", namespace="$namespace"}[2m])/120) by (pod, node_id)milvus_querynode_sq_req_countIl numero accumulato di richieste di lettura evase dal nodo di query a causa della limitazione del traffico.

Coordinatore dei dati

PannelloDescrizione del pannelloPromQL (linguaggio di interrogazione di Prometheus)Le metriche Milvus utilizzateDescrizione delle metriche Milvus
Numero di nodi datiIl numero di nodi di dati gestiti da Data Coord.sum(milvus_datacoord_datanode_num{app_kubernetes_io_instance=~"$instance", app_kubernetes_io_name="$app_name", namespace="$namespace"}) by (app_kubernetes_io_instance)milvus_datacoord_datanode_numIl numero di nodi dati gestiti da Data Coord.
Numero di segmentiIl numero di tutti i tipi di segmenti registrati nei metadati da Data Coord.sum(milvus_datacoord_segment_num{app_kubernetes_io_instance=~"$instance", app_kubernetes_io_name="$app_name", namespace="$namespace"}) by (segment_state)milvus_datacoord_segment_numIl numero di tutti i tipi di segmenti registrati nei metadati da data coord.
I tipi di segmenti includono: caduti, scaricati, in fase di flushing, in crescita e sigillati.
Numero di raccolteIl numero di raccolte registrate nei metadati per coord. dati.sum(milvus_datacoord_collection_num{app_kubernetes_io_instance=~"$instance", app_kubernetes_io_name="$app_name", namespace="$namespace"}) by (app_kubernetes_io_instance)milvus_datacoord_collection_numIl numero di raccolte registrate nei metadati per coord. dati.
Righe memorizzateIl numero accumulato di righe di dati validi e scaricati in data coord.sum(milvus_datacoord_stored_rows_num{app_kubernetes_io_instance=~"$instance", app_kubernetes_io_name="$app_name", namespace="$namespace"}) by (app_kubernetes_io_instance)milvus_datacoord_stored_rows_numIl numero accumulato di righe di dati validi e scaricati nella coord. dati.
Frequenza delle righe memorizzateIl numero medio di righe scaricate al secondo negli ultimi due minuti.sum(increase(milvus_datacoord_stored_rows_count{app_kubernetes_io_instance=~"$instance", app_kubernetes_io_name="$app_name", namespace="$namespace"}[2m])/120) by (pod, node_id)milvus_datacoord_stored_rows_countIl numero accumulato di righe scaricate per coord. dati.
Tempo di sincronizzazioneIl numero medio, massimo e minimo di epoch time sincronizzati da data coord in ciascun canale fisico.avg(milvus_datacoord_sync_epoch_time{app_kubernetes_io_instance=~"$instance", app_kubernetes_io_name="$app_name", namespace="$namespace"}) by (app_kubernetes_io_instance) max(milvus_datacoord_sync_epoch_time{app_kubernetes_io_instance=~"$instance", app_kubernetes_io_name="$app_name", namespace="$namespace"}) by (app_kubernetes_io_instance) min(milvus_datacoord_sync_epoch_time{app_kubernetes_io_instance=~"$instance", app_kubernetes_io_name="$app_name", namespace="$namespace"}) by (app_kubernetes_io_instance)milvus_datacoord_sync_epoch_timeL'epoch time di ogni canale fisico (tempo Unix, i millisecondi trascorsi dal 1° gennaio 1970).
Dimensione del binlog memorizzatoLa dimensione totale del binlog memorizzato.sum(milvus_datacoord_stored_binlog_size{app_kubernetes_io_instance=~"$instance", app_kubernetes_io_name="$app_name", namespace="$namespace"}) by (app_kubernetes_io_instance)milvus_datacoord_stored_binlog_sizeLa dimensione totale del binlog memorizzato in Milvus.

Nodo dati

PannelloDescrizione del pannelloPromQL (linguaggio di interrogazione di Prometheus)Le metriche Milvus utilizzateDescrizione della metrica Milvus
Numero del diagramma di flussoIl numero di oggetti del diagramma di flusso che corrispondono a ciascun nodo di dati.sum(milvus_datanode_flowgraph_num{app_kubernetes_io_instance=~"$instance", app_kubernetes_io_name="$app_name", namespace="$namespace"}) by (pod, node_id)milvus_datanode_flowgraph_numIl numero di oggetti del diagramma di flusso.
Ogni shard di una collezione corrisponde a un oggetto flowgraph.
Tasso di consumo di righe di messaggiIl numero di righe di messaggi in streaming consumate al secondo da ciascun nodo dati negli ultimi due minuti.sum(increase(milvus_datanode_msg_rows_count{app_kubernetes_io_instance=~"$instance", app_kubernetes_io_name="$app_name", namespace="$namespace"}[2m])/120) by (msg_type, pod, node_id)milvus_datanode_msg_rows_countIl numero di righe di messaggi in streaming consumate.
Attualmente, i messaggi di streaming contati dal nodo dati includono solo i messaggi di inserimento e cancellazione.
Tasso di dimensione dei dati di lavaggioLa dimensione di ciascun messaggio di flush registrata al secondo da ciascun nodo dati negli ultimi due minuti.sum(increase(milvus_datanode_flushed_data_size{app_kubernetes_io_instance=~"$instance", app_kubernetes_io_name="$app_name", namespace="$namespace"}[2m])/120) by (msg_type, pod, node_id)milvus_datanode_flushed_data_sizeLa dimensione di ogni messaggio scaricato.
Attualmente, i messaggi in streaming contati dal nodo dati includono solo i messaggi di inserimento e cancellazione.
Numero di consumatoriIl numero di consumatori creati su ciascun nodo dati.sum(milvus_datanode_consumer_num{app_kubernetes_io_instance=~"$instance", app_kubernetes_io_name="$app_name", namespace="$namespace"}) by (pod, node_id)milvus_datanode_consumer_numIl numero di consumatori creati su ogni nodo dati.
Ogni flowgraph corrisponde a un consumatore.
Numero di produttoriIl numero di produttori creati su ogni nodo di dati.sum(milvus_datanode_producer_num{app_kubernetes_io_instance=~"$instance", app_kubernetes_io_name="$app_name", namespace="$namespace"}) by (pod, node_id)milvus_datanode_producer_numIl numero di consumatori creati su ogni nodo di dati.
Ogni shard di una collezione corrisponde a un produttore di canali delta e a un produttore di canali timetick.
Tempo di sincronizzazioneIl numero medio, massimo e minimo di epoch time sincronizzati da ciascun nodo dati in tutti gli argomenti fisici.avg(milvus_datanode_sync_epoch_time{app_kubernetes_io_instance=~"$instance", app_kubernetes_io_name="$app_name", namespace="$namespace"}) by (pod, node_id) max(milvus_datanode_sync_epoch_time{app_kubernetes_io_instance=~"$instance", app_kubernetes_io_name="$app_name", namespace="$namespace"}) by (pod, node_id) min(milvus_datanode_sync_epoch_time{app_kubernetes_io_instance=~"$instance", app_kubernetes_io_name="$app_name", namespace="$namespace"}) by (pod, node_id)milvus_datanode_sync_epoch_timeL'epoch time (tempo Unix, i millisecondi trascorsi dal 1° gennaio 1970) di ogni argomento fisico su un nodo dati.
Numero di segmenti non lavatiIl numero di segmenti non lavati creati su ogni nodo dati.sum(milvus_datanode_unflushed_segment_num{app_kubernetes_io_instance=~"$instance", app_kubernetes_io_name="$app_name", namespace="$namespace"}) by (pod, node_id)milvus_datanode_unflushed_segment_numIl numero di segmenti non lavati creati su ogni nodo dati.
Latenza del buffer di codificaLa latenza media e il 99° percentile del tempo utilizzato per codificare un buffer da ciascun nodo dati negli ultimi due minuti.p99:
histogram_quantile(0.99, sum by (le, pod, node_id) (rate(milvus_datanode_encode_buffer_latency_bucket{app_kubernetes_io_instance=~"$instance", app_kubernetes_io_name="$app_name", namespace="$namespace"}[2m])))
avg:
sum(increase(milvus_datanode_encode_buffer_latency_sum{app_kubernetes_io_instance=~"$instance", app_kubernetes_io_name="$app_name", namespace="$namespace"}[2m])) by(pod, node_id) / sum(increase(milvus_datanode_encode_buffer_latency_count{app_kubernetes_io_instance=~"$instance", app_kubernetes_io_name="$app_name", namespace="$namespace"}[2m])) by(pod, node_id)
milvus_datanode_encode_buffer_latencyIl tempo impiegato da ciascun nodo dati per codificare un buffer.
Latenza di salvataggio dei datiLa latenza media e il 99° percentile del tempo utilizzato per scrivere un buffer nel livello di archiviazione da ciascun nodo dati negli ultimi due minuti.p99:
histogram_quantile(0.99, sum by (le, pod, node_id) (rate(milvus_datanode_save_latency_bucket{app_kubernetes_io_instance=~"$instance", app_kubernetes_io_name="$app_name", namespace="$namespace"}[2m])))
avg:
sum(increase(milvus_datanode_save_latency_sum{app_kubernetes_io_instance=~"$instance", app_kubernetes_io_name="$app_name", namespace="$namespace"}[2m])) by(pod, node_id) / sum(increase(milvus_datanode_save_latency_count{app_kubernetes_io_instance=~"$instance", app_kubernetes_io_name="$app_name", namespace="$namespace"}[2m])) by(pod, node_id)
milvus_datanode_save_latencyIl tempo impiegato da ciascun nodo dati per scrivere un buffer nel livello di archiviazione.
Frequenza di operazione di lavaggioIl numero di volte in cui ogni nodo dati esegue il flush di un buffer al secondo negli ultimi due minuti.sum(increase(milvus_datanode_flush_buffer_op_count{app_kubernetes_io_instance=~"$instance", app_kubernetes_io_name="$app_name", namespace="$namespace"}[2m])/120) by (status, pod, node_id)milvus_datanode_flush_buffer_op_countIl numero accumulato di volte in cui un nodo dati esegue il lavaggio di un buffer.
Velocità di funzionamento dell'autoflushIl numero di volte in cui ogni nodo dati esegue il lavaggio automatico di un buffer al secondo negli ultimi due minuti.sum(increase(milvus_datanode_autoflush_buffer_op_count{app_kubernetes_io_instance=~"$instance", app_kubernetes_io_name="$app_name", namespace="$namespace"}[2m])/120) by (status, pod, node_id)milvus_datanode_autoflush_buffer_op_countIl numero accumulato di volte in cui un nodo dati esegue il lavaggio automatico di un buffer.
Velocità di richiesta di lavaggioIl numero di volte in cui ogni nodo dati riceve una richiesta di lavaggio del buffer al secondo negli ultimi due minuti.sum(increase(milvus_datanode_flush_req_count{app_kubernetes_io_instance=~"$instance", app_kubernetes_io_name="$app_name", namespace="$namespace"}[2m])/120) by (status, pod, node_id)milvus_datanode_flush_req_countIl numero accumulato di volte in cui un nodo dati riceve una richiesta di lavaggio da un coord. dati.
Latenza di compattazioneLa latenza media e il 99° percentile del tempo impiegato da ciascun nodo dati per eseguire un'attività di compattazione negli ultimi due minuti.p99:
histogram_quantile(0.99, sum by (le, pod, node_id) (rate(milvus_datanode_compaction_latency_bucket{app_kubernetes_io_instance=~"$instance", app_kubernetes_io_name="$app_name", namespace="$namespace"}[2m])))
avg:
sum(increase(milvus_datanode_compaction_latency_sum{app_kubernetes_io_instance=~"$instance", app_kubernetes_io_name="$app_name", namespace="$namespace"}[2m])) by(pod, node_id) / sum(increase(milvus_datanode_compaction_latency_count{app_kubernetes_io_instance=~"$instance", app_kubernetes_io_name="$app_name", namespace="$namespace"}[2m])) by(pod, node_id)
milvus_datanode_compaction_latencyIl tempo impiegato da ciascun nodo dati per eseguire un'attività di compattazione.

Coordinatore dell'indice

PannelloDescrizione del pannelloPromQL (linguaggio di interrogazione di Prometheus)Le metriche Milvus utilizzateDescrizione delle metriche Milvus
Velocità di richiesta dell'indiceIl numero medio di richieste di creazione di indici ricevute al secondo negli ultimi due minuti.sum(increase(milvus_indexcoord_indexreq_count{app_kubernetes_io_instance=~"$instance", app_kubernetes_io_name="$app_name", namespace="$namespace"}[2m])/120) by (status)milvus_indexcoord_indexreq_countIl numero di richieste di costruzione dell'indice ricevute.
Conteggio delle attività di indicizzazioneIl conteggio di tutte le attività di indicizzazione registrate nei metadati dell'indice.sum(milvus_indexcoord_indextask_count{app_kubernetes_io_instance=~"$instance", app_kubernetes_io_name="$app_name", namespace="$namespace"}) by (index_task_status)milvus_indexcoord_indextask_countIl conteggio di tutte le attività di indicizzazione registrate nei metadati dell'indice.
Numero di nodi indiceIl numero di nodi indice gestiti.sum(milvus_indexcoord_indexnode_num{app_kubernetes_io_instance=~"$instance", app_kubernetes_io_name="$app_name", namespace="$namespace"}) by (app_kubernetes_io_instance)milvus_indexcoord_indexnode_numIl numero di nodi indice gestiti.

Nodo indice

PannelloDescrizione del pannelloPromQL (linguaggio di interrogazione di Prometheus)Le metriche Milvus utilizzateDescrizione delle metriche Milvus
Tasso di attività dell'indiceIl numero medio di attività di creazione di indici ricevute da ciascun nodo indice al secondo negli ultimi due minuti.sum(increase(milvus_indexnode_index_task_count{app_kubernetes_io_instance=~"$instance", app_kubernetes_io_name="$app_name", namespace="$namespace"}[2m])/120) by (status, pod, node_id)milvus_indexnode_index_task_countIl numero di task di costruzione dell'indice ricevuti.
Latenza del campo di caricoLa latenza media e il 99° percentile del tempo utilizzato da ciascun nodo indice per caricare i dati del campo del segmento ogni volta negli ultimi due minuti.p99:
histogram_quantile(0.99, sum by (le, pod, node_id) (rate(milvus_indexnode_load_field_latency_bucket{app_kubernetes_io_instance=~"$instance", app_kubernetes_io_name="$app_name", namespace="$namespace"}[2m])))
avg:
sum(increase(milvus_indexnode_load_field_latency_sum{app_kubernetes_io_instance=~"$instance", app_kubernetes_io_name="$app_name", namespace="$namespace"}[2m])) by(pod, node_id) / sum(increase(milvus_indexnode_load_field_latency_count{app_kubernetes_io_instance=~"$instance", app_kubernetes_io_name="$app_name", namespace="$namespace"}[2m])) by(pod, node_id)
milvus_indexnode_load_field_latencyIl tempo utilizzato dal nodo indice per caricare i dati del campo segmento.
Latenza del campo di decodificaLa latenza media e il 99° percentile del tempo utilizzato da ciascun nodo indice per codificare i dati di campo ogni volta negli ultimi due minuti.p99:
histogram_quantile(0.99, sum by (le, pod, node_id) (rate(milvus_indexnode_decode_field_latency_bucket{app_kubernetes_io_instance=~"$instance", app_kubernetes_io_name="$app_name", namespace="$namespace"}[2m])))
avg:
sum(increase(milvus_indexnode_decode_field_latency_sum{app_kubernetes_io_instance=~"$instance", app_kubernetes_io_name="$app_name", namespace="$namespace"}[2m])) by(pod, node_id) / sum(increase(milvus_indexnode_decode_field_latency_count{app_kubernetes_io_instance=~"$instance", app_kubernetes_io_name="$app_name", namespace="$namespace"}[2m])) by(pod, node_id)
milvus_indexnode_decode_field_latencyIl tempo utilizzato per decodificare i dati del campo.
Latenza dell'indice di compilazioneLa latenza media e il 99° percentile del tempo utilizzato da ciascun nodo indice per costruire gli indici negli ultimi due minuti.p99:
histogram_quantile(0.99, sum by (le, pod, node_id) (rate(milvus_indexnode_build_index_latency_bucket{app_kubernetes_io_instance=~"$instance", app_kubernetes_io_name="$app_name", namespace="$namespace"}[2m])))
avg:
sum(increase(milvus_indexnode_build_index_latency_sum{app_kubernetes_io_instance=~"$instance", app_kubernetes_io_name="$app_name", namespace="$namespace"}[2m])) by(pod, node_id) / sum(increase(milvus_indexnode_build_index_latency_count{app_kubernetes_io_instance=~"$instance", app_kubernetes_io_name="$app_name", namespace="$namespace"}[2m])) by(pod, node_id)
milvus_indexnode_build_index_latencyIl tempo utilizzato per costruire gli indici.
Latenza dell'indice di codificaLa latenza media e il 99° percentile del tempo utilizzato da ciascun nodo indice per codificare i file indice negli ultimi due minuti.p99:
histogram_quantile(0.99, sum by (le, pod, node_id) (rate(milvus_indexnode_encode_index_latency_bucket{app_kubernetes_io_instance=~"$instance", app_kubernetes_io_name="$app_name", namespace="$namespace"}[2m])))
avg:
sum(increase(milvus_indexnode_encode_index_latency_sum{app_kubernetes_io_instance=~"$instance", app_kubernetes_io_name="$app_name", namespace="$namespace"}[2m])) by(pod, node_id) / sum(increase(milvus_indexnode_encode_index_latency_count{app_kubernetes_io_instance=~"$instance", app_kubernetes_io_name="$app_name", namespace="$namespace"}[2m])) by(pod, node_id)
milvus_indexnode_encode_index_latencyIl tempo utilizzato per codificare i file di indice.
Latenza del salvataggio dell'indiceLa latenza media e il 99° percentile del tempo utilizzato da ciascun nodo indice per salvare i file indice negli ultimi due minuti.p99:
histogram_quantile(0.99, sum by (le, pod, node_id) (rate(milvus_indexnode_save_index_latency_bucket{app_kubernetes_io_instance=~"$instance", app_kubernetes_io_name="$app_name", namespace="$namespace"}[2m])))
avg:
sum(increase(milvus_indexnode_save_index_latency_sum{app_kubernetes_io_instance=~"$instance", app_kubernetes_io_name="$app_name", namespace="$namespace"}[2m])) by(pod, node_id) / sum(increase(milvus_indexnode_save_index_latency_count{app_kubernetes_io_instance=~"$instance", app_kubernetes_io_name="$app_name", namespace="$namespace"}[2m])) by(pod, node_id)
milvus_indexnode_save_index_latencyIl tempo utilizzato per salvare i file di indice.

Tradotto daDeepLogo

Tabella dei contenuti
Feedback

Questa pagina è stata utile?