🚀 Coba Zilliz Cloud, Milvus yang sepenuhnya terkelola, secara gratis—rasakan performa 10x lebih cepat! Coba Sekarang>>

milvus-logo
LFAI
Beranda
  • Panduan Administrasi
  • Home
  • Docs
  • Panduan Administrasi

  • Pemantauan, Peringatan & Log

  • Pemantauan

  • Dasbor Metrik Milvus

Dasbor Metrik Milvus

Milvus mengeluarkan daftar metrik deret waktu yang terperinci selama waktu berjalan. Anda dapat menggunakan Prometheus dan Grafana untuk memvisualisasikan metrik. Topik ini memperkenalkan metrik pemantauan yang ditampilkan di Dasbor Grafana Milvus.

Satuan waktu dalam topik ini adalah milidetik. Dan "persentil ke-99" dalam topik ini mengacu pada fakta bahwa 99 persen dari statistik waktu dikontrol dalam nilai tertentu.

Kami sarankan untuk membaca ikhtisar kerangka kerja pemantauan Milvus untuk memahami metrik Prometheus terlebih dahulu.

Proksi

PanelDeskripsi panelPromQL (bahasa kueri Prometheus)Metrik Milvus yang digunakanDeskripsi metrik Milvus
Tingkat Jumlah Vektor PencarianJumlah rata-rata vektor yang ditanyakan per detik oleh setiap proxy dalam dua menit terakhir.sum(increase(milvus_proxy_search_vectors_count{app_kubernetes_io_instance=~"$instance", app_kubernetes_io_name="$app_name", namespace="$namespace"}[2m])/120) by (pod, node_id)milvus_proxy_search_vectors_countAkumulasi jumlah vektor yang ditanyakan.
Tingkat Jumlah Vektor SisipanJumlah rata-rata vektor yang dimasukkan per detik oleh setiap proxy dalam dua menit terakhir.sum(increase(milvus_proxy_insert_vectors_count{app_kubernetes_io_instance=~"$instance", app_kubernetes_io_name="$app_name", namespace="$namespace"}[2m])/120) by (pod, node_id)milvus_proxy_insert_vectors_countJumlah akumulasi vektor yang dimasukkan.
Latensi PencarianLatensi rata-rata dan persentil ke-99 dari latensi penerimaan permintaan pencarian dan kueri oleh setiap proxy dalam dua menit terakhir.p99:
histogram_quantile(0.99, sum by (le, query_type, pod, node_id) (rate(milvus_proxy_sq_latency_bucket{app_kubernetes_io_instance=~"$instance", app_kubernetes_io_name="$app_name", namespace="$namespace"}[2m])))
avg:
sum(increase(milvus_proxy_sq_latency_sum{app_kubernetes_io_instance=~"$instance", app_kubernetes_io_name="$app_name", namespace="$namespace"}[2m])) by (pod, node_id, query_type) / sum(increase(milvus_proxy_sq_latency_count{app_kubernetes_io_instance=~"$instance", app_kubernetes_io_name="$app_name", namespace="$namespace"}[2m])) by (pod, node_id, query_type)
milvus_proxy_sq_latencyLatensi permintaan pencarian dan kueri.
Latensi Pencarian KoleksiLatensi rata-rata dan persentil ke-99 dari latensi penerimaan permintaan pencarian dan kueri ke koleksi tertentu oleh setiap proxy dalam dua menit terakhir.p99:
histogram_quantile(0.99, sum by (le, query_type, pod, node_id) (rate(milvus_proxy_collection_sq_latency_bucket{app_kubernetes_io_instance=~"$instance", app_kubernetes_io_name="$app_name", namespace="$namespace", collection_name=~"$collection"}[2m])))
avg:
sum(increase(milvus_proxy_collection_sq_latency_sum{app_kubernetes_io_instance=~"$instance", app_kubernetes_io_name="$app_name", namespace="$namespace", collection_name=~"$collection"}[2m])) by (pod, node_id, query_type) / sum(increase(milvus_proxy_collection_sq_latency_count{app_kubernetes_io_instance=~"$instance", app_kubernetes_io_name="$app_name", namespace="$namespace", collection_name=~"$collection"}[2m])) by (pod, node_id, query_type)
milvus_proxy_collection_sq_latency_sumLatensi permintaan pencarian dan kueri ke koleksi tertentu
Latensi MutasiLatensi rata-rata dan persentil ke-99 dari latensi penerimaan permintaan mutasi oleh setiap proksi dalam dua menit terakhir.p99:
histogram_quantile(0.99, sum by (le, msg_type, pod, node_id) (rate(milvus_proxy_mutation_latency_bucket{app_kubernetes_io_instance=~"$instance", app_kubernetes_io_name="$app_name", namespace="$namespace"}[2m])))
avg:
sum(increase(milvus_proxy_mutation_latency_sum{app_kubernetes_io_instance=~"$instance", app_kubernetes_io_name="$app_name", namespace="$namespace"}[2m])) by (pod, node_id, msg_type) / sum(increase(milvus_proxy_mutation_latency_count{app_kubernetes_io_instance=~"$instance", app_kubernetes_io_name="$app_name", namespace="$namespace"}[2m])) by (pod, node_id, msg_type)
milvus_proxy_mutation_latency_sumLatensi permintaan mutasi.
Latensi Mutasi KoleksiLatensi rata-rata dan persentil ke-99 dari latensi penerimaan permintaan mutasi ke koleksi tertentu oleh setiap proxy dalam dua menit terakhir.p99:
histogram_quantile(0.99, sum by (le, query_type, pod, node_id) (rate(milvus_proxy_collection_sq_latency_bucket{app_kubernetes_io_instance=~"$instance", app_kubernetes_io_name="$app_name", namespace="$namespace", collection_name=~"$collection"}[2m])))
avg:
sum(increase(milvus_proxy_collection_sq_latency_sum{app_kubernetes_io_instance=~"$instance", app_kubernetes_io_name="$app_name", namespace="$namespace", collection_name=~"$collection"}[2m])) by (pod, node_id, query_type) / sum(increase(milvus_proxy_collection_sq_latency_count{app_kubernetes_io_instance=~"$instance", app_kubernetes_io_name="$app_name", namespace="$namespace", collection_name=~"$collection"}[2m])) by (pod, node_id, query_type)
milvus_proxy_collection_sq_latency_sumLatensi permintaan mutasi ke koleksi tertentu
Latensi Hasil Pencarian TungguLatensi rata-rata dan persentil ke-99 dari latensi antara pengiriman permintaan pencarian dan kueri dan penerimaan hasil oleh proxy dalam dua menit terakhir.p99:
histogram_quantile(0.99, sum by (le, query_type, pod, node_id) (rate(milvus_proxy_sq_wait_result_latency_bucket{app_kubernetes_io_instance=~"$instance", app_kubernetes_io_name="$app_name", namespace="$namespace"}[2m])))
avg:
sum(increase(milvus_proxy_sq_wait_result_latency_sum{app_kubernetes_io_instance=~"$instance", app_kubernetes_io_name="$app_name", namespace="$namespace"}[2m])) by (pod, node_id, query_type) / sum(increase(milvus_proxy_sq_wait_result_latency_count{app_kubernetes_io_instance=~"$instance", app_kubernetes_io_name="$app_name", namespace="$namespace"}[2m])) by (pod, node_id, query_type)
milvus_proxy_sq_wait_result_latencyLatensi antara mengirim permintaan pencarian dan kueri dan menerima hasil.
Mengurangi Latensi Hasil PencarianLatensi rata-rata dan persentil ke-99 dari latensi penggabungan hasil pencarian dan kueri oleh proxy dalam dua menit terakhir.p99:
histogram_quantile(0.99, sum by (le, query_type, pod, node_id) (rate(milvus_proxy_sq_reduce_result_latency_bucket{app_kubernetes_io_instance=~"$instance", app_kubernetes_io_name="$app_name", namespace="$namespace"}[2m])))
avg:
sum(increase(milvus_proxy_sq_reduce_result_latency_sum{app_kubernetes_io_instance=~"$instance", app_kubernetes_io_name="$app_name", namespace="$namespace"}[2m])) by (pod, node_id, query_type) / sum(increase(milvus_proxy_sq_reduce_result_latency_count{app_kubernetes_io_instance=~"$instance", app_kubernetes_io_name="$app_name", namespace="$namespace"}[2m])) by (pod, node_id, query_type)
milvus_proxy_sq_reduce_result_latencyLatensi penggabungan hasil pencarian dan kueri yang dikembalikan oleh setiap simpul kueri.
Menguraikan Latensi Hasil PencarianLatensi rata-rata dan persentil ke-99 dari latensi penguraian hasil pencarian dan kueri oleh proxy dalam dua menit terakhir.p99:
histogram_quantile(0.99, sum by (le, query_type, pod, node_id) (rate(milvus_proxy_sq_decode_result_latency_bucket{app_kubernetes_io_instance=~"$instance", app_kubernetes_io_name="$app_name", namespace="$namespace"}[2m])))
avg:
sum(increase(milvus_proxy_sq_decode_result_latency_sum{app_kubernetes_io_instance=~"$instance", app_kubernetes_io_name="$app_name", namespace="$namespace"}[2m])) by (pod, node_id, query_type) / sum(increase(milvus_proxy_sq_decode_resultlatency_count{app_kubernetes_io_instance=~"$instance", app_kubernetes_io_name="$app_name", namespace="$namespace"}[2m])) by (pod, node_id, query_type)
milvus_proxy_sq_decode_result_latencyLatensi penguraian kode setiap hasil pencarian dan kueri.
Jumlah Objek Aliran MsgJumlah rata-rata, maksimum, dan minimum dari objek msgstream yang dibuat oleh setiap proxy pada topik fisik yang sesuai dalam dua menit terakhir.avg(milvus_proxy_msgstream_obj_num{app_kubernetes_io_instance=~"$instance", app_kubernetes_io_name="$app_name", namespace="$namespace"}) by (pod, node_id) max(milvus_proxy_msgstream_obj_num{app_kubernetes_io_instance=~"$instance", app_kubernetes_io_name="$app_name", namespace="$namespace"}) by (pod, node_id) min(milvus_proxy_msgstream_obj_num{app_kubernetes_io_instance=~"$instance", app_kubernetes_io_name="$app_name", namespace="$namespace"}) by (pod, node_id)milvus_proxy_msgstream_obj_numJumlah objek msgstream yang dibuat pada setiap topik fisik.
Latensi Pengiriman MutasiLatensi rata-rata dan persentil ke-99 dari latensi pengiriman permintaan penyisipan atau penghapusan oleh setiap proxy dalam dua menit terakhir.p99:
histogram_quantile(0.99, sum by (le, msg_type, pod, node_id) (rate(milvus_proxy_mutation_send_latency_bucket{app_kubernetes_io_instance=~"$instance", app_kubernetes_io_name="$app_name", namespace="$namespace"}[2m])))
avg:
sum(increase(milvus_proxy_mutation_send_latency_sum{app_kubernetes_io_instance=~"$instance", app_kubernetes_io_name="$app_name", namespace="$namespace"}[2m])) by (pod, node_id, msg_type) / sum(increase(milvus_proxy_mutation_send_latency_count{app_kubernetes_io_instance=~"$instance", app_kubernetes_io_name="$app_name", namespace="$namespace"}[2m])) by (pod, node_id, msg_type)
milvus_proxy_mutation_send_latencyLatensi pengiriman permintaan penyisipan atau penghapusan.
Cache Hit RateTingkat hit cache rata-rata dari operasi termasuk GeCollectionID, GetCollectionInfo, dan GetCollectionSchema per detik dalam dua menit terakhir.sum(increase(milvus_proxy_cache_hit_count{app_kubernetes_io_instance=~"$instance", app_kubernetes_io_name="$app_name", namespace="$namespace", cache_state="hit"}[2m])/120) by(cache_name, pod, node_id) / sum(increase(milvus_proxy_cache_hit_count{app_kubernetes_io_instance=~"$instance", app_kubernetes_io_name="$app_name", namespace="$namespace"}[2m])/120) by(cache_name, pod, node_id)milvus_proxy_cache_hit_countStatistik tingkat keberhasilan dan kegagalan setiap operasi pembacaan cache.
Latensi Pembaruan CacheLatensi rata-rata dan persentil ke-99 dari latensi pembaruan cache oleh proxy dalam dua menit terakhir.p99:
histogram_quantile(0.99, sum by (le, pod, node_id) (rate(milvus_proxy_cache_update_latency_bucket{app_kubernetes_io_instance=~"$instance", app_kubernetes_io_name="$app_name", namespace="$namespace"}[2m])))
avg:
sum(increase(milvus_proxy_cache_update_latency_sum{app_kubernetes_io_instance=~"$instance", app_kubernetes_io_name="$app_name", namespace="$namespace"}[2m])) by (pod, node_id) / sum(increase(milvus_proxy_cache_update_latency_count{app_kubernetes_io_instance=~"$instance", app_kubernetes_io_name="$app_name", namespace="$namespace"}[2m])) by (pod, node_id)
milvus_proxy_cache_update_latencyLatensi pembaruan cache setiap kali.
Waktu SinkronisasiJumlah rata-rata, maksimum, dan minimum waktu epoch yang disinkronkan oleh setiap proxy di saluran fisik yang sesuai.avg(milvus_proxy_sync_epoch_time{app_kubernetes_io_instance=~"$instance", app_kubernetes_io_name="$app_name", namespace="$namespace"}) by (pod, node_id) max(milvus_proxy_sync_epoch_time{app_kubernetes_io_instance=~"$instance", app_kubernetes_io_name="$app_name", namespace="$namespace"}) by (pod, node_id) min(milvus_proxy_sync_epoch_time{app_kubernetes_io_instance=~"$instance", app_kubernetes_io_name="$app_name", namespace="$namespace"}) by (pod, node_id)milvus_proxy_sync_epoch_timeWaktu epoch setiap saluran fisik (waktu Unix, milidetik yang telah berlalu sejak 1 Januari 1970).
Ada default ChannelName selain dari saluran fisik.
Menerapkan Latensi PKLatensi rata-rata dan persentil ke-99 dari latensi aplikasi kunci utama oleh setiap proxy dalam dua menit terakhir.p99:
histogram_quantile(0.99, sum by (le, pod, node_id) (rate(milvus_proxy_apply_pk_latency_bucket{app_kubernetes_io_instance=~"$instance", app_kubernetes_io_name="$app_name", namespace="$namespace"}[2m])))
avg:
sum(increase(milvus_proxy_apply_pk_latency_sum{app_kubernetes_io_instance=~"$instance", app_kubernetes_io_name="$app_name", namespace="$namespace"}[2m])) by (pod, node_id) / sum(increase(milvus_proxy_apply_pk_latency_count{app_kubernetes_io_instance=~"$instance", app_kubernetes_io_name="$app_name", namespace="$namespace"}[2m])) by (pod, node_id)
milvus_proxy_apply_pk_latencyLatensi penerapan kunci utama.
Menerapkan Latensi Stempel WaktuLatensi rata-rata dan persentil ke-99 dari latensi aplikasi stempel waktu oleh setiap proxy dalam dua menit terakhir.p99:
histogram_quantile(0.99, sum by (le, pod, node_id) (rate(milvus_proxy_apply_timestamp_latency_bucket{app_kubernetes_io_instance=~"$instance", app_kubernetes_io_name="$app_name", namespace="$namespace"}[2m])))
avg:
sum(increase(milvus_proxy_apply_timestamp_latency_sum{app_kubernetes_io_instance=~"$instance", app_kubernetes_io_name="$app_name", namespace="$namespace"}[2m])) by (pod, node_id) / sum(increase(milvus_proxy_apply_timestamp_latency_count{app_kubernetes_io_instance=~"$instance", app_kubernetes_io_name="$app_name", namespace="$namespace"}[2m])) by (pod, node_id)
milvus_proxy_apply_timestamp_latencyLatensi penerapan stempel waktu.
Tingkat Keberhasilan PermintaanJumlah permintaan yang berhasil diterima per detik oleh setiap proxy, dengan perincian terperinci dari setiap jenis permintaan. Jenis permintaan yang mungkin adalah DescribeCollection, DescribeIndex, GetCollectionStatistics, HasCollection, Search, Query, ShowPartitions, Insert, dll.
sum(increase(milvus_proxy_req_count{app_kubernetes_io_instance=~"$instance", app_kubernetes_io_name="$app_name", namespace="$namespace", status="success"}[2m])/120) by(function_name, pod, node_id)milvus_proxy_req_countJumlah semua jenis permintaan yang diterima
Tingkat Permintaan GagalJumlah permintaan gagal yang diterima per detik oleh setiap proxy, dengan perincian terperinci dari setiap jenis permintaan. Jenis permintaan yang mungkin adalah DescribeCollection, DescribeIndex, GetCollectionStatistics, HasCollection, Search, Query, ShowPartitions, Insert, dll.
sum(increase(milvus_proxy_req_count{app_kubernetes_io_instance=~"$instance", app_kubernetes_io_name="$app_name", namespace="$namespace", status="fail"}[2m])/120) by(function_name, pod, node_id)milvus_proxy_req_countJumlah semua jenis permintaan yang diterima
Latensi PermintaanLatensi rata-rata dan persentil ke-99 dari latensi semua jenis permintaan yang diterima oleh setiap proxyp99:
histogram_quantile(0.99, sum by (le, pod, node_id, function_name) (rate(milvus_proxy_req_latency_bucket{app_kubernetes_io_instance=~"$instance", app_kubernetes_io_name="$app_name", namespace="$namespace"}[2m])))
avg:
sum(increase(milvus_proxy_req_latency_sum{app_kubernetes_io_instance=~"$instance", app_kubernetes_io_name="$app_name", namespace="$namespace"}[2m])) by (pod, node_id, function_name) / sum(increase(milvus_proxy_req_latency_count{app_kubernetes_io_instance=~"$instance", app_kubernetes_io_name="$app_name", namespace="$namespace"}[2m])) by (pod, node_id, function_name)
milvus_proxy_req_latencyLatensi dari semua jenis permintaan penerimaan
Tingkat Byte Permintaan Sisipkan/HapusJumlah byte permintaan sisipkan dan hapus yang diterima per detik oleh proxy dalam dua menit terakhir.sum(increase(milvus_proxy_receive_bytes_count{app_kubernetes_io_instance=~"$instance", app_kubernetes_io_name="$app_name", namespace="$namespace"}[2m])/120) by(pod, node_id)milvus_proxy_receive_bytes_countJumlah permintaan sisipkan dan hapus.
Kecepatan Pengiriman ByteJumlah byte per detik yang dikirim kembali ke klien ketika setiap proxy merespons permintaan pencarian dan kueri dalam dua menit terakhir.sum(increase(milvus_proxy_send_bytes_count{app_kubernetes_io_instance=~"$instance", app_kubernetes_io_name="$app_name", namespace="$namespace"}[2m])/120) by(pod, node_id)milvus_proxy_send_bytes_countJumlah byte yang dikirim kembali ke klien ketika setiap proxy merespons permintaan pencarian dan kueri.

Koordinator root

PanelDeskripsi panelPromQL (bahasa kueri Prometheus)Metrik Milvus yang digunakanDeskripsi metrik Milvus
Jumlah Simpul ProksiJumlah proxy yang dibuat.sum(milvus_rootcoord_proxy_num{app_kubernetes_io_instance=~"$instance", app_kubernetes_io_name="$app_name", namespace="$namespace"}) by (app_kubernetes_io_instance)milvus_rootcoord_proxy_numJumlah proxy.
Waktu SinkronisasiJumlah rata-rata, maksimum, dan minimum waktu epoch yang disinkronkan oleh setiap koordinat root di setiap saluran fisik (PChannel).avg(milvus_rootcoord_sync_epoch_time{app_kubernetes_io_instance=~"$instance", app_kubernetes_io_name="$app_name", namespace="$namespace"}) by (app_kubernetes_io_instance) max(milvus_rootcoord_sync_epoch_time{app_kubernetes_io_instance=~"$instance", app_kubernetes_io_name="$app_name", namespace="$namespace"}) by (app_kubernetes_io_instance) min(milvus_rootcoord_sync_epoch_time{app_kubernetes_io_instance=~"$instance", app_kubernetes_io_name="$app_name", namespace="$namespace"}) by (app_kubernetes_io_instance)milvus_rootcoord_sync_epoch_timeWaktu epoch setiap saluran fisik (waktu Unix, milidetik yang telah berlalu sejak 1 Januari 1970).
Tingkat Permintaan DDLStatus dan jumlah permintaan DDL per detik dalam dua menit terakhir.sum(increase(milvus_rootcoord_ddl_req_count{app_kubernetes_io_instance=~"$instance", app_kubernetes_io_name="$app_name", namespace="$namespace"}[2m])/120) by (status, function_name)milvus_rootcoord_ddl_req_countJumlah total permintaan DDL termasuk CreateCollection, DescribeCollection, DescribeSegments, HasCollection, ShowCollections, ShowPartitions, dan ShowSegments.
Latensi Permintaan DDLLatensi rata-rata dan persentil ke-99 latensi permintaan DDL dalam dua menit terakhir.p99:
histogram_quantile(0.99, sum by (le, function_name) (rate(milvus_rootcoord_ddl_req_latency_bucket{app_kubernetes_io_instance=~"$instance", app_kubernetes_io_name="$app_name", namespace="$namespace"}[2m])))
avg:
sum(increase(milvus_rootcoord_ddl_req_latency_sum{app_kubernetes_io_instance=~"$instance", app_kubernetes_io_name="$app_name", namespace="$namespace"}[2m])) by (function_name) / sum(increase(milvus_rootcoord_ddl_req_latency_count{app_kubernetes_io_instance=~"$instance", app_kubernetes_io_name="$app_name", namespace="$namespace"}[2m])) by (function_name)
milvus_rootcoord_ddl_req_latencyLatensi semua jenis permintaan DDL.
Latensi Timetick SinkronisasiLatensi rata-rata dan persentil ke-99 dari waktu yang digunakan oleh root coord untuk menyinkronkan semua cap waktu ke PChannel dalam dua menit terakhir.p99:
histogram_quantile(0.99, sum by (le) (rate(milvus_rootcoord_sync_timetick_latency_bucket{app_kubernetes_io_instance=~"$instance", app_kubernetes_io_name="$app_name", namespace="$namespace"}[2m])))
avg:
sum(increase(milvus_rootcoord_sync_timetick_latency_sum{app_kubernetes_io_instance=~"$instance", app_kubernetes_io_name="$app_name", namespace="$namespace"}[2m])) / sum(increase(milvus_rootcoord_sync_timetick_latency_count{app_kubernetes_io_instance=~"$instance", app_kubernetes_io_name="$app_name", namespace="$namespace"}[2m]))
milvus_rootcoord_sync_timetick_latencywaktu yang digunakan oleh root coord untuk menyinkronkan semua cap waktu ke pchannel.
Tingkat Alokasi IDJumlah ID yang diberikan oleh root coord per detik dalam dua menit terakhir.sum(increase(milvus_rootcoord_id_alloc_count{app_kubernetes_io_instance=~"$instance", app_kubernetes_io_name="$app_name", namespace="$namespace"}[2m])/120)milvus_rootcoord_id_alloc_countJumlah akumulasi ID yang diberikan oleh root coord.
Stempel waktuCap waktu terbaru dari root coord.milvus_rootcoord_timestamp{app_kubernetes_io_instance=~"$instance", app_kubernetes_io_name="$app_name", namespace="$namespace"}milvus_rootcoord_timestampCap waktu terbaru dari koordinat akar.
Stempel Waktu TersimpanStempel waktu yang telah ditetapkan sebelumnya yang disimpan oleh root coord di penyimpanan meta.milvus_rootcoord_timestamp_saved{app_kubernetes_io_instance=~"$instance", app_kubernetes_io_name="$app_name", namespace="$namespace"}milvus_rootcoord_timestamp_savedStempel waktu yang telah ditetapkan sebelumnya yang disimpan oleh root coord di penyimpanan meta.
Stempel waktu ditetapkan 3 detik sebelumnya. Dan stempel waktu diperbarui dan disimpan dalam penyimpanan meta setiap 50 milidetik.
Jumlah KoleksiJumlah total koleksi.sum(milvus_rootcoord_collection_num{app_kubernetes_io_instance=~"$instance", app_kubernetes_io_name="$app_name", namespace="$namespace"}) by (app_kubernetes_io_instance)milvus_rootcoord_collection_numJumlah total koleksi yang ada di Milvus saat ini.
Partition NumJumlah total partisi.sum(milvus_rootcoord_partition_num{app_kubernetes_io_instance=~"$instance", app_kubernetes_io_name="$app_name", namespace="$namespace"}) by (app_kubernetes_io_instance)milvus_rootcoord_partition_numJumlah total partisi yang ada di Milvus saat ini.
Jumlah Saluran DMLJumlah total saluran DML.sum(milvus_rootcoord_dml_channel_num{app_kubernetes_io_instance=~"$instance", app_kubernetes_io_name="$app_name", namespace="$namespace"}) by (app_kubernetes_io_instance)milvus_rootcoord_dml_channel_numJumlah total saluran DML yang ada di Milvus saat ini.
Msgstream NumJumlah total msgstream.sum(milvus_rootcoord_msgstream_obj_num{app_kubernetes_io_instance=~"$instance", app_kubernetes_io_name="$app_name", namespace="$namespace"}) by (app_kubernetes_io_instance)milvus_rootcoord_msgstream_obj_numJumlah total msgstream yang ada di Milvus saat ini.
Jumlah KredensialJumlah total kredensial.sum(milvus_rootcoord_credential_num{app_kubernetes_io_instance=~"$instance", app_kubernetes_io_name="$app_name", namespace="$namespace"}) by (app_kubernetes_io_instance)milvus_rootcoord_credential_numJumlah total kredensial di Milvus saat ini.
Penundaan Detak WaktuJumlah waktu tunda tick delay maksimum dari grafik aliran pada semua DataNode dan QueryNode.sum(milvus_rootcoord_time_tick_delay{app_kubernetes_io_instance=~"$instance", app_kubernetes_io_name="$app_name", namespace="$namespace"}) by (app_kubernetes_io_instance)milvus_rootcoord_time_tick_delayWaktu tunda tick delay maksimum dari grafik aliran pada setiap DataNode dan QueryNode.

Koordinator kueri

PanelDeskripsi panelPromQL (bahasa kueri Prometheus)Metrik Milvus yang digunakanDeskripsi metrik Milvus
Jumlah Koleksi yang DimuatJumlah koleksi yang saat ini dimuat ke dalam memori.sum(milvus_querycoord_collection_num{app_kubernetes_io_instance=~"$instance", app_kubernetes_io_name="$app_name", namespace="$namespace"}) by (app_kubernetes_io_instance)milvus_querycoord_collection_numJumlah koleksi yang saat ini dimuat oleh Milvus.
Jumlah Entitas yang DimuatJumlah entitas yang saat ini dimuat ke dalam memori.sum(milvus_querycoord_entity_num{app_kubernetes_io_instance=~"$instance", app_kubernetes_io_name="$app_name", namespace="$namespace"}) by (app_kubernetes_io_instance)milvus_querycoord_entitiy_numJumlah entitas yang sedang dimuat oleh Milvus.
Tingkat Permintaan MuatJumlah permintaan beban per detik dalam dua menit terakhir.sum(increase(milvus_querycoord_load_req_count{app_kubernetes_io_instance=~"$instance", app_kubernetes_io_name="$app_name", namespace="$namespace"}[2m])120) by (status)milvus_querycoord_load_req_countJumlah akumulasi permintaan beban.
Tingkat Permintaan RilisJumlah permintaan rilis per detik dalam dua menit terakhir.sum(increase(milvus_querycoord_release_req_count{app_kubernetes_io_instance=~"$instance", app_kubernetes_io_name="$app_name", namespace="$namespace"}[2m])/120) by (status)milvus_querycoord_release_req_countJumlah akumulasi permintaan pelepasan.
Latensi Permintaan MuatLatensi rata-rata dan persentil ke-99 dari latensi permintaan muat dalam dua menit terakhir.p99:
histogram_quantile(0.99, sum by (le) (rate(milvus_querycoord_load_latency_bucket{app_kubernetes_io_instance=~"$instance", app_kubernetes_io_name="$app_name", namespace="$namespace"}[2m])))
avg:
sum(increase(milvus_querycoord_load_latency_sum{app_kubernetes_io_instance=~"$instance", app_kubernetes_io_name="$app_name", namespace="$namespace"}[2m])) / sum(increase(milvus_querycoord_load_latency_count{app_kubernetes_io_instance=~"$instance", app_kubernetes_io_name="$app_name", namespace="$namespace"}[2m]))
milvus_querycoord_load_latencyWaktu yang digunakan untuk menyelesaikan permintaan muat.
Latensi Permintaan RilisLatensi rata-rata dan persentil ke-99 dari latensi permintaan rilis dalam dua menit terakhir.p99:
histogram_quantile(0.99, sum by (le) (rate(milvus_querycoord_release_latency_bucket{app_kubernetes_io_instance=~"$instance", app_kubernetes_io_name="$app_name", namespace="$namespace"}[2m])))
avg:
sum(increase(milvus_querycoord_release_latency_sum{app_kubernetes_io_instance=~"$instance", app_kubernetes_io_name="$app_name", namespace="$namespace"}[2m])) / sum(increase(milvus_querycoord_release_latency_count{app_kubernetes_io_instance=~"$instance", app_kubernetes_io_name="$app_name", namespace="$namespace"}[2m]))
milvus_querycoord_release_latencyWaktu yang digunakan untuk menyelesaikan permintaan pelepasan.
Tugas Sub-BebanJumlah tugas sub beban.sum(milvus_querycoord_child_task_num{app_kubernetes_io_instance=~"$instance", app_kubernetes_io_name="$app_name", namespace="$namespace"}) by (app_kubernetes_io_instance)milvus_querycoord_child_task_numJumlah sub tugas beban.
Sebuah koordinat kueri membagi permintaan muat menjadi beberapa sub tugas muat.
Tugas Beban IndukJumlah tugas beban induk.sum(milvus_querycoord_parent_task_num{app_kubernetes_io_instance=~"$instance", app_kubernetes_io_name="$app_name", namespace="$namespace"}) by (app_kubernetes_io_instance)milvus_querycoord_parent_task_numJumlah sub tugas beban.
Setiap permintaan beban berhubungan dengan tugas induk dalam antrean tugas.
Latensi Tugas Sub-MemuatLatensi rata-rata dan persentil ke-99 dari latensi tugas sub-muat dalam dua menit terakhir.p99:
histogram_quantile(0.99, sum by (le) (rate(milvus_querycoord_child_task_latency_bucket{app_kubernetes_io_instance=~"$instance", app_kubernetes_io_name="$app_name", namespace="$namespace"}[2m])))
avg:
sum(increase(milvus_querycoord_child_task_latency_sum{app_kubernetes_io_instance=~"$instance", app_kubernetes_io_name="$app_name", namespace="$namespace"}[2m])) / sum(increase(milvus_querycoord_child_task_latency_count{app_kubernetes_io_instance=~"$instance", app_kubernetes_io_name="$app_name", namespace="$namespace"}[2m])) namespace"}[2m])))
milvus_querycoord_child_task_latencyLatensi untuk menyelesaikan tugas sub-beban.
Jumlah Node KueriJumlah node kueri yang dikelola oleh koordinat kueri.sum(milvus_querycoord_querynode_num{app_kubernetes_io_instance=~"$instance", app_kubernetes_io_name="$app_name", namespace="$namespace"}) by (app_kubernetes_io_instance)milvus_querycoord_querynode_numJumlah node kueri yang dikelola oleh koordinat kueri.

Node kueri

PanelDeskripsi panelPromQL (bahasa kueri Prometheus)Metrik Milvus yang digunakanDeskripsi metrik Milvus
Jumlah Koleksi yang DimuatJumlah koleksi yang dimuat ke dalam memori oleh setiap simpul kueri.sum(milvus_querynode_collection_num{app_kubernetes_io_instance=~"$instance", app_kubernetes_io_name="$app_name", namespace="$namespace"}) by (pod, node_id)milvus_querynode_collection_numJumlah koleksi yang dimuat oleh setiap node kueri.
Partition Loaded NumJumlah partisi yang dimuat ke dalam memori oleh setiap simpul kueri.sum(milvus_querynode_partition_num{app_kubernetes_io_instance=~"$instance", app_kubernetes_io_name="$app_name", namespace="$namespace"}) by (pod, node_id)milvus_querynode_partition_numJumlah partisi yang dimuat oleh setiap simpul kueri.
Segmen Dimuat NumJumlah segmen yang dimuat ke dalam memori oleh setiap node kueri.sum(milvus_querynode_segment_num{app_kubernetes_io_instance=~"$instance", app_kubernetes_io_name="$app_name", namespace="$namespace"}) by (pod, node_id)milvus_querynode_segment_numJumlah segmen yang dimuat oleh setiap node kueri.
Jumlah Entitas yang Dapat DiperolehJumlah entitas yang dapat ditanyakan dan dicari pada setiap node kueri.sum(milvus_querynode_entity_num{app_kubernetes_io_instance=~"$instance", app_kubernetes_io_name="$app_name", namespace="$namespace"}) by (pod, node_id)milvus_querynode_entity_numJumlah entitas yang dapat di-query dan dapat dicari pada setiap node kueri.
Saluran Virtual DMLJumlah saluran virtual DML yang ditonton oleh setiap node kueri.sum(milvus_querynode_dml_vchannel_num{app_kubernetes_io_instance=~"$instance", app_kubernetes_io_name="$app_name", namespace="$namespace"}) by (pod, node_id)milvus_querynode_dml_vchannel_numJumlah saluran virtual DML yang ditonton oleh setiap node kueri.
Saluran Virtual DeltaJumlah saluran delta yang ditonton oleh setiap node kueri.sum(milvus_querynode_delta_vchannel_num{app_kubernetes_io_instance=~"$instance", app_kubernetes_io_name="$app_name", namespace="$namespace"}) by (pod, node_id)milvus_querynode_delta_vchannel_numJumlah saluran delta yang ditonton oleh setiap node kueri.
Jumlah KonsumenJumlah konsumen di setiap node kueri.sum(milvus_querynode_consumer_num{app_kubernetes_io_instance=~"$instance", app_kubernetes_io_name="$app_name", namespace="$namespace"}) by (pod, node_id)milvus_querynode_consumer_numJumlah konsumen di setiap node kueri.
Tingkat Permintaan PencarianJumlah total permintaan pencarian dan permintaan kueri yang diterima per detik oleh setiap node kueri dan jumlah permintaan pencarian dan permintaan kueri yang berhasil dalam dua menit terakhir.sum(increase(milvus_querynode_sq_req_count{app_kubernetes_io_instance=~"$instance", app_kubernetes_io_name="$app_name", namespace="$namespace"}[2m])/120) by (query_type, status, pod, node_id)milvus_querynode_sq_req_countJumlah akumulasi permintaan pencarian dan permintaan kueri.
Latensi Permintaan PencarianLatensi rata-rata dan persentil ke-99 dari waktu yang digunakan dalam permintaan pencarian dan permintaan kueri oleh setiap node kueri dalam dua menit terakhir.
Panel ini menampilkan latensi permintaan pencarian dan permintaan kueri yang berstatus "sukses" atau "total".
p99:
histogram_quantile(0.99, sum by (le, pod, node_id) (rate(milvus_querynode_sq_req_latency_bucket{app_kubernetes_io_instance=~"$instance", app_kubernetes_io_name="$app_name", namespace="$namespace"}[2m])))
avg:
sum(increase(milvus_querynode_sq_req_latency_sum{app_kubernetes_io_instance=~"$instance", app_kubernetes_io_name="$app_name", namespace="$namespace"}[2m])) by(pod, node_id, query_type) / sum(increase(milvus_querynode_sq_req_latency_count{app_kubernetes_io_instance=~"$instance", app_kubernetes_io_name="$app_name", namespace="$namespace"}[2m])) by(pod, node_id, query_type)
milvus_querynode_sq_req_latencyLatensi permintaan pencarian dari simpul kueri.
Pencarian dalam Latensi AntrianLatensi rata-rata dan persentil ke-99 dari latensi permintaan pencarian dan kueri dalam antrean dalam dua menit terakhir.p99:
histogram_quantile(0.99, sum by (le, pod, node_id, query_type) (rate(milvus_querynode_sq_queue_latency_bucket{app_kubernetes_io_instance=~"$instance", app_kubernetes_io_name="$app_name", namespace="$namespace"}[2m])))
avg:
sum(increase(milvus_querynode_sq_queue_latency_sum{app_kubernetes_io_instance=~"$instance", app_kubernetes_io_name="$app_name", namespace="$namespace"}[2m])) by(pod, node_id, query_type) / sum(increase(milvus_querynode_sq_queue_latency_count{app_kubernetes_io_instance=~"$instance", app_kubernetes_io_name="$app_name", namespace="$namespace"}[2m])) by(pod, node_id, query_type)
milvus_querynode_sq_queue_latencyLatensi permintaan pencarian dan kueri yang diterima oleh simpul kueri.
Latensi Segmen PencarianLatensi rata-rata dan persentil ke-99 dari waktu yang dibutuhkan setiap node kueri untuk mencari dan meminta segmen dalam dua menit terakhir.
Status segmen dapat disegel atau berkembang.
p99:
histogram_quantile(0.99, sum by (le, query_type, segment_state, pod, node_id) (rate(milvus_querynode_sq_segment_latency_bucket{app_kubernetes_io_instance=~"$instance", app_kubernetes_io_name="$app_name", namespace="$namespace"}[2m])))
avg:
sum(increase(milvus_querynode_sq_segment_latency_sum{app_kubernetes_io_instance=~"$instance", app_kubernetes_io_name="$app_name", namespace="$namespace"}[2m])) by(pod, node_id, query_type, segment_state) / sum(increase(milvus_querynode_sq_segment_latency_count{app_kubernetes_io_instance=~"$instance", app_kubernetes_io_name="$app_name", namespace="$namespace"}[2m])) by(pod, node_id, query_type, segment_state)
milvus_querynode_sq_segment_latencyWaktu yang dibutuhkan setiap simpul kueri untuk mencari dan menanyakan setiap segmen.
Latensi Permintaan SegmenLatensi rata-rata dan persentil ke-99 dari waktu yang dibutuhkan setiap simpul kueri untuk mencari dan meminta di segcore dalam dua menit terakhir.p99:
histogram_quantile(0.99, sum by (le, query_type, pod, node_id) (rate(milvus_querynode_sq_core_latency_bucket{app_kubernetes_io_instance=~"$instance", app_kubernetes_io_name="$app_name", namespace="$namespace"}[2m])))
avg:
sum(increase(milvus_querynode_sq_core_latency_sum{app_kubernetes_io_instance=~"$instance", app_kubernetes_io_name="$app_name", namespace="$namespace"}[2m])) by(pod, node_id, query_type) / sum(increase(milvus_querynode_sq_core_latency_count{app_kubernetes_io_instance=~"$instance", app_kubernetes_io_name="$app_name", namespace="$namespace"}[2m])) by(pod, node_id, query_type)
milvus_querynode_sq_core_latencyWaktu yang dibutuhkan setiap simpul kueri untuk mencari dan membuat kueri dalam segcore.
Pencarian Mengurangi LatensiLatensi rata-rata dan persentil ke-99 dari waktu yang digunakan oleh setiap node kueri selama tahap pengurangan pencarian atau kueri dalam dua menit terakhir.p99:
histogram_quantile(0.99, sum by (le, pod, node_id, query_type) (rate(milvus_querynode_sq_reduce_latency_bucket{app_kubernetes_io_instance=~"$instance", app_kubernetes_io_name="$app_name", namespace="$namespace"}[2m])))
avg:
sum(increase(milvus_querynode_sq_reduce_latency_sum{app_kubernetes_io_instance=~"$instance", app_kubernetes_io_name="$app_name", namespace="$namespace"}[2m])) by(pod, node_id, query_type) / sum(increase(milvus_querynode_sq_reduce_latency_count{app_kubernetes_io_instance=~"$instance", app_kubernetes_io_name="$app_name", namespace="$namespace"}[2m])) by(pod, node_id, query_type)
milvus_querynode_sq_reduce_latencyWaktu yang dihabiskan setiap kueri selama tahap pengurangan.
Latensi Segmen MuatLatensi rata-rata dan persentil ke-99 dari waktu yang dibutuhkan setiap simpul kueri untuk memuat segmen dalam dua menit terakhir.p99:
histogram_quantile(0.99, sum by (le, pod, node_id) (rate(milvus_querynode_load_segment_latency_bucket{app_kubernetes_io_instance=~"$instance", app_kubernetes_io_name="$app_name", namespace="$namespace"}[2m])))
avg:
sum(increase(milvus_querynode_load_segment_latency_sum{app_kubernetes_io_instance=~"$instance", app_kubernetes_io_name="$app_name", namespace="$namespace"}[2m])) by(pod, node_id) / sum(increase(milvus_querynode_load_segment_latency_count{app_kubernetes_io_instance=~"$instance", app_kubernetes_io_name="$app_name", namespace="$namespace"}[2m])) by(pod, node_id)
milvus_querynode_load_segment_latency_bucketWaktu yang dibutuhkan setiap simpul kueri untuk memuat sebuah segmen.
Jumlah FlowgraphJumlah flowgraph di setiap node kueri.sum(milvus_querynode_flowgraph_num{app_kubernetes_io_instance=~"$instance", app_kubernetes_io_name="$app_name", namespace="$namespace"}) by (pod, node_id)milvus_querynode_flowgraph_numJumlah flowgraph di setiap node kueri.
Panjang Tugas Baca yang Belum TerpecahkanPanjang antrean permintaan baca yang belum terselesaikan di setiap node kueri.sum(milvus_querynode_read_task_unsolved_len{app_kubernetes_io_instance=~"$instance", app_kubernetes_io_name="$app_name", namespace="$namespace"}) by (pod, node_id)milvus_querynode_read_task_unsolved_lenPanjang antrean permintaan baca yang belum terpecahkan.
Panjang Tugas Baca SiapPanjang antrian permintaan baca yang akan dieksekusi di setiap node kueri.sum(milvus_querynode_read_task_ready_len{app_kubernetes_io_instance=~"$instance", app_kubernetes_io_name="$app_name", namespace="$namespace"}) by (pod, node_id)milvus_querynode_read_task_ready_lenPanjang antrean permintaan baca yang akan dieksekusi.
Jumlah Tugas Baca ParalelJumlah permintaan baca bersamaan yang sedang dieksekusi di setiap node kueri.sum(milvus_querynode_read_task_concurrency{app_kubernetes_io_instance=~"$instance", app_kubernetes_io_name="$app_name", namespace="$namespace"}) by (pod, node_id)milvus_querynode_read_task_concurrencyJumlah permintaan baca bersamaan yang sedang dieksekusi.
Perkirakan Penggunaan CPUPenggunaan CPU oleh setiap node kueri yang diperkirakan oleh penjadwal.sum(milvus_querynode_estimate_cpu_usage{app_kubernetes_io_instance=~"$instance", app_kubernetes_io_name="$app_name", namespace="$namespace"}) by (pod, node_id)milvus_querynode_estimate_cpu_usagePenggunaan CPU oleh setiap node kueri yang diperkirakan oleh penjadwal.
Bila nilainya 100, ini berarti seluruh CPU virtual (vCPU) digunakan.
Ukuran Grup PencarianJumlah rata-rata dan persentil ke-99 dari ukuran grup pencarian (yaitu jumlah total permintaan pencarian asli dalam permintaan pencarian gabungan yang dieksekusi oleh setiap node kueri) dalam dua menit terakhir.p99:
histogram_quantile(0.99, sum by (le, pod, node_id) (rate(milvus_querynode_search_group_size_bucket{app_kubernetes_io_instance=~"$instance", app_kubernetes_io_name="$app_name", namespace="$namespace"}[2m])))
avg:
sum(increase(milvus_querynode_search_group_size_sum{app_kubernetes_io_instance=~"$instance", app_kubernetes_io_name="$app_name", namespace="$namespace"}[2m])) by(pod, node_id) / sum(increase(milvus_querynode_search_group_size_count{app_kubernetes_io_instance=~"$instance", app_kubernetes_io_name="$app_name", namespace="$namespace"}[2m])) by(pod, node_id)
milvus_querynode_load_segment_latency_bucketJumlah tugas pencarian asli di antara tugas pencarian gabungan dari bucket yang berbeda (yaitu Ukuran grup pencarian).
Pencarian NQJumlah rata-rata dan persentil ke-99 dari jumlah kueri (NQ) yang dilakukan saat setiap simpul kueri mengeksekusi permintaan pencarian dalam dua menit terakhir.p99:
histogram_quantile(0.99, sum by (le, pod, node_id) (rate(milvus_querynode_search_group_size_bucket{app_kubernetes_io_instance=~"$instance", app_kubernetes_io_name="$app_name", namespace="$namespace"}[2m])))
avg:
sum(increase(milvus_querynode_search_group_size_sum{app_kubernetes_io_instance=~"$instance", app_kubernetes_io_name="$app_name", namespace="$namespace"}[2m])) by(pod, node_id) / sum(increase(milvus_querynode_search_group_size_count{app_kubernetes_io_instance=~"$instance", app_kubernetes_io_name="$app_name", namespace="$namespace"}[2m])) by(pod, node_id)
milvus_querynode_load_segment_latency_bucketJumlah kueri (NQ) permintaan pencarian.
NQ Grup PencarianJumlah rata-rata dan persentil ke-99 dari NQ permintaan pencarian yang digabungkan dan dieksekusi oleh setiap simpul kueri dalam dua menit terakhir.p99:
histogram_quantile(0.99, sum by (le, pod, node_id) (rate(milvus_querynode_search_group_nq_bucket{app_kubernetes_io_instance=~"$instance", app_kubernetes_io_name="$app_name", namespace="$namespace"}[2m])))
avg:
sum(increase(milvus_querynode_search_group_nq_sum{app_kubernetes_io_instance=~"$instance", app_kubernetes_io_name="$app_name", namespace="$namespace"}[2m])) by(pod, node_id) / sum(increase(milvus_querynode_search_group_nq_count{app_kubernetes_io_instance=~"$instance", app_kubernetes_io_name="$app_name", namespace="$namespace"}[2m])) by(pod, node_id)
milvus_querynode_load_segment_latency_bucketNQ permintaan pencarian yang digabungkan dari berbagai bucket.
Pencarian Top_KJumlah rata-rata dan persentil ke-99 dari Top_K permintaan pencarian yang dieksekusi oleh setiap simpul kueri dalam dua menit terakhir.p99:
histogram_quantile(0.99, sum by (le, pod, node_id) (rate(milvus_querynode_search_topk_bucket{app_kubernetes_io_instance=~"$instance", app_kubernetes_io_name="$app_name", namespace="$namespace"}[2m])))
avg:
sum(increase(milvus_querynode_search_topk_sum{app_kubernetes_io_instance=~"$instance", app_kubernetes_io_name="$app_name", namespace="$namespace"}[2m])) by(pod, node_id) / sum(increase(milvus_querynode_search_topk_count{app_kubernetes_io_instance=~"$instance", app_kubernetes_io_name="$app_name", namespace="$namespace"}[2m])) by(pod, node_id)
milvus_querynode_load_segment_latency_bucketJumlah Top_K permintaan pencarian.
Kelompok Pencarian Top_KJumlah rata-rata dan persentil ke-99 dari Top_K permintaan pencarian yang digabungkan dan dieksekusi oleh setiap simpul kueri dalam dua menit terakhir.p99:
histogram_quantile(0.99, sum by (le, pod, node_id) (rate(milvus_querynode_search_group_topk_bucket{app_kubernetes_io_instance=~"$instance", app_kubernetes_io_name="$app_name", namespace="$namespace"}[2m])))
avg:
sum(increase(milvus_querynode_search_group_topk_sum{app_kubernetes_io_instance=~"$instance", app_kubernetes_io_name="$app_name", namespace="$namespace"}[2m])) by(pod, node_id) / sum(increase(milvus_querynode_search_group_topk_count{app_kubernetes_io_instance=~"$instance", app_kubernetes_io_name="$app_name", namespace="$namespace"}[2m])) by(pod, node_id)
milvus_querynode_load_segment_latency_bucketJumlah Top_K permintaan pencarian yang digabungkan dari berbagai bucket.
Tingkat Permintaan Baca yang DigusurJumlah permintaan baca yang digusur per detik oleh setiap simpul kueri dalam dua menit terakhir.sum(increase(milvus_querynode_read_evicted_count{app_kubernetes_io_instance=~"$instance", app_kubernetes_io_name="$app_name", namespace="$namespace"}[2m])/120) by (pod, node_id)milvus_querynode_sq_req_countJumlah akumulasi permintaan baca yang digusur oleh simpul kueri karena pembatasan lalu lintas.

Koordinator data

PanelDeskripsi panelPromQL (bahasa kueri Prometheus)Metrik Milvus yang digunakanDeskripsi metrik Milvus
Data Node NumJumlah node data yang dikelola oleh koordinat data.sum(milvus_datacoord_datanode_num{app_kubernetes_io_instance=~"$instance", app_kubernetes_io_name="$app_name", namespace="$namespace"}) by (app_kubernetes_io_instance)milvus_datacoord_datanode_numJumlah node data yang dikelola oleh koordinat data.
Jumlah SegmenJumlah semua jenis segmen yang dicatat dalam metadata oleh koordin data.sum(milvus_datacoord_segment_num{app_kubernetes_io_instance=~"$instance", app_kubernetes_io_name="$app_name", namespace="$namespace"}) by (segment_state)milvus_datacoord_segment_numJumlah semua jenis segmen yang dicatat dalam metadata menurut koordinat data.
Jenis-jenis segmen meliputi: jatuh, disiram, disiram, tumbuh, dan disegel.
Jumlah KoleksiJumlah koleksi yang tercatat dalam metadata menurut koordinat data.sum(milvus_datacoord_collection_num{app_kubernetes_io_instance=~"$instance", app_kubernetes_io_name="$app_name", namespace="$namespace"}) by (app_kubernetes_io_instance)milvus_datacoord_collection_numJumlah koleksi yang dicatat dalam metadata menurut koordinat data.
Baris TersimpanJumlah akumulasi baris data yang valid dan dibuang dalam koordinat data.sum(milvus_datacoord_stored_rows_num{app_kubernetes_io_instance=~"$instance", app_kubernetes_io_name="$app_name", namespace="$namespace"}) by (app_kubernetes_io_instance)milvus_datacoord_stored_rows_numJumlah akumulasi baris data yang valid dan dibuang dalam koordinat data.
Tingkat Baris TersimpanJumlah rata-rata baris yang di-flush per detik dalam dua menit terakhir.sum(increase(milvus_datacoord_stored_rows_count{app_kubernetes_io_instance=~"$instance", app_kubernetes_io_name="$app_name", namespace="$namespace"}[2m])/120) by (pod, node_id)milvus_datacoord_stored_rows_countAkumulasi jumlah baris yang di-flush oleh koordinat data.
Waktu SinkronisasiJumlah rata-rata, maksimum, dan minimum waktu epoch yang disinkronkan oleh koordin data di setiap saluran fisik.avg(milvus_datacoord_sync_epoch_time{app_kubernetes_io_instance=~"$instance", app_kubernetes_io_name="$app_name", namespace="$namespace"}) by (app_kubernetes_io_instance) max(milvus_datacoord_sync_epoch_time{app_kubernetes_io_instance=~"$instance", app_kubernetes_io_name="$app_name", namespace="$namespace"}) by (app_kubernetes_io_instance) min(milvus_datacoord_sync_epoch_time{app_kubernetes_io_instance=~"$instance", app_kubernetes_io_name="$app_name", namespace="$namespace"}) by (app_kubernetes_io_instance)milvus_datacoord_sync_epoch_timeWaktu epoch setiap saluran fisik (waktu Unix, milidetik yang telah berlalu sejak 1 Januari 1970).
Ukuran Binlog yang DisimpanUkuran total binlog yang disimpan.sum(milvus_datacoord_stored_binlog_size{app_kubernetes_io_instance=~"$instance", app_kubernetes_io_name="$app_name", namespace="$namespace"}) by (app_kubernetes_io_instance)milvus_datacoord_stored_binlog_sizeUkuran total binlog yang tersimpan dalam Milvus.

Simpul data

PanelDeskripsi panelPromQL (bahasa kueri Prometheus)Metrik Milvus yang digunakanDeskripsi metrik Milvus
Flowgraph NumJumlah objek flowgraph yang berhubungan dengan setiap node data.sum(milvus_datanode_flowgraph_num{app_kubernetes_io_instance=~"$instance", app_kubernetes_io_name="$app_name", namespace="$namespace"}) by (pod, node_id)milvus_datanode_flowgraph_numJumlah objek flowgraph.
Setiap pecahan dalam koleksi berhubungan dengan objek flowgraph.
Tingkat Konsumsi Baris MsgJumlah baris pesan streaming yang dikonsumsi per detik oleh setiap simpul data dalam dua menit terakhir.sum(increase(milvus_datanode_msg_rows_count{app_kubernetes_io_instance=~"$instance", app_kubernetes_io_name="$app_name", namespace="$namespace"}[2m])/120) by (msg_type, pod, node_id)milvus_datanode_msg_rows_countJumlah baris pesan streaming yang dikonsumsi.
Saat ini, pesan streaming yang dihitung oleh simpul data hanya mencakup pesan penyisipan dan penghapusan.
Tingkat Ukuran Data FlushUkuran setiap pesan yang dibilas yang direkam per detik oleh setiap simpul data dalam dua menit terakhir.sum(increase(milvus_datanode_flushed_data_size{app_kubernetes_io_instance=~"$instance", app_kubernetes_io_name="$app_name", namespace="$namespace"}[2m])/120) by (msg_type, pod, node_id)milvus_datanode_flushed_data_sizeUkuran dari setiap pesan yang dibilas.
Saat ini, pesan streaming yang dihitung oleh simpul data hanya mencakup pesan penyisipan dan penghapusan.
Jumlah KonsumenJumlah konsumen yang dibuat pada setiap simpul data.sum(milvus_datanode_consumer_num{app_kubernetes_io_instance=~"$instance", app_kubernetes_io_name="$app_name", namespace="$namespace"}) by (pod, node_id)milvus_datanode_consumer_numJumlah konsumen yang dibuat pada setiap simpul data.
Setiap diagram alir berhubungan dengan sebuah konsumen.
Producer NumJumlah produsen yang dibuat pada setiap simpul data.sum(milvus_datanode_producer_num{app_kubernetes_io_instance=~"$instance", app_kubernetes_io_name="$app_name", namespace="$namespace"}) by (pod, node_id)milvus_datanode_producer_numJumlah konsumen yang dibuat pada setiap simpul data.
Setiap pecahan dalam sebuah koleksi berhubungan dengan produsen saluran delta dan produsen saluran timetick.
Waktu SinkronisasiJumlah rata-rata, maksimum, dan minimum waktu epoch yang disinkronkan oleh setiap simpul data di semua topik fisik.avg(milvus_datanode_sync_epoch_time{app_kubernetes_io_instance=~"$instance", app_kubernetes_io_name="$app_name", namespace="$namespace"}) by (pod, node_id) max(milvus_datanode_sync_epoch_time{app_kubernetes_io_instance=~"$instance", app_kubernetes_io_name="$app_name", namespace="$namespace"}) by (pod, node_id) min(milvus_datanode_sync_epoch_time{app_kubernetes_io_instance=~"$instance", app_kubernetes_io_name="$app_name", namespace="$namespace"}) by (pod, node_id)milvus_datanode_sync_epoch_timeWaktu epoch (waktu Unix, milidetik yang telah berlalu sejak 1 Januari 1970.) dari setiap topik fisik pada simpul data.
Jumlah Segmen yang Tidak DibilasJumlah segmen yang tidak di-flush yang dibuat pada setiap simpul data.sum(milvus_datanode_unflushed_segment_num{app_kubernetes_io_instance=~"$instance", app_kubernetes_io_name="$app_name", namespace="$namespace"}) by (pod, node_id)milvus_datanode_unflushed_segment_numJumlah segmen yang tidak di-flush yang dibuat pada setiap simpul data.
Latensi Penyandian Buffer EncodeLatensi rata-rata dan persentil ke-99 dari waktu yang digunakan untuk meng-encode buffer oleh setiap simpul data dalam dua menit terakhir.p99:
histogram_quantile(0.99, sum by (le, pod, node_id) (rate(milvus_datanode_encode_buffer_latency_bucket{app_kubernetes_io_instance=~"$instance", app_kubernetes_io_name="$app_name", namespace="$namespace"}[2m])))
avg:
sum(increase(milvus_datanode_encode_buffer_latency_sum{app_kubernetes_io_instance=~"$instance", app_kubernetes_io_name="$app_name", namespace="$namespace"}[2m])) by(pod, node_id) / sum(increase(milvus_datanode_encode_buffer_latency_count{app_kubernetes_io_instance=~"$instance", app_kubernetes_io_name="$app_name", namespace="$namespace"}[2m])) by(pod, node_id)
milvus_datanode_encode_buffer_latencyWaktu yang dibutuhkan setiap simpul data untuk menyandikan buffer.
Menyimpan Latensi DataLatensi rata-rata dan persentil ke-99 dari waktu yang digunakan untuk menulis buffer ke dalam lapisan penyimpanan oleh setiap node data dalam dua menit terakhir.p99:
histogram_quantile(0.99, sum by (le, pod, node_id) (rate(milvus_datanode_save_latency_bucket{app_kubernetes_io_instance=~"$instance", app_kubernetes_io_name="$app_name", namespace="$namespace"}[2m])))
avg:
sum(increase(milvus_datanode_save_latency_sum{app_kubernetes_io_instance=~"$instance", app_kubernetes_io_name="$app_name", namespace="$namespace"}[2m])) by(pod, node_id) / sum(increase(milvus_datanode_save_latency_count{app_kubernetes_io_instance=~"$instance", app_kubernetes_io_name="$app_name", namespace="$namespace"}[2m])) by(pod, node_id)
milvus_datanode_save_latencyWaktu yang dibutuhkan setiap simpul data untuk menulis buffer ke dalam lapisan penyimpanan.
Laju Pengoperasian Flush (Flush Operate Rate)Berapa kali setiap simpul data mengosongkan buffer per detik dalam dua menit terakhir.sum(increase(milvus_datanode_flush_buffer_op_count{app_kubernetes_io_instance=~"$instance", app_kubernetes_io_name="$app_name", namespace="$namespace"}[2m])/120) by (status, pod, node_id)milvus_datanode_flush_buffer_op_countJumlah akumulasi berapa kali simpul data mengisi buffer.
Tingkat Pengoperasian Flush OtomatisBerapa kali setiap simpul data secara otomatis mengisi buffer per detik dalam dua menit terakhir.sum(increase(milvus_datanode_autoflush_buffer_op_count{app_kubernetes_io_instance=~"$instance", app_kubernetes_io_name="$app_name", namespace="$namespace"}[2m])/120) by (status, pod, node_id)milvus_datanode_autoflush_buffer_op_countJumlah akumulasi berapa kali simpul data melakukan flushing otomatis pada buffer.
Tingkat Permintaan FlushBerapa kali setiap simpul data menerima permintaan flush buffer per detik dalam dua menit terakhir.sum(increase(milvus_datanode_flush_req_count{app_kubernetes_io_instance=~"$instance", app_kubernetes_io_name="$app_name", namespace="$namespace"}[2m])/120) by (status, pod, node_id)milvus_datanode_flush_req_countJumlah akumulasi berapa kali node data menerima permintaan flush dari koordinat data.
Latensi PemadatanLatensi rata-rata dan persentil 99 dari waktu yang dibutuhkan setiap node data untuk menjalankan tugas pemadatan dalam dua menit terakhir.p99:
histogram_quantile(0.99, sum by (le, pod, node_id) (rate(milvus_datanode_compaction_latency_bucket{app_kubernetes_io_instance=~"$instance", app_kubernetes_io_name="$app_name", namespace="$namespace"}[2m])))
avg:
sum(increase(milvus_datanode_compaction_latency_sum{app_kubernetes_io_instance=~"$instance", app_kubernetes_io_name="$app_name", namespace="$namespace"}[2m])) by(pod, node_id) / sum(increase(milvus_datanode_compaction_latency_count{app_kubernetes_io_instance=~"$instance", app_kubernetes_io_name="$app_name", namespace="$namespace"}[2m])) by(pod, node_id)
milvus_datanode_compaction_latencyWaktu yang dibutuhkan setiap simpul data untuk menjalankan tugas pemadatan.

Koordinator indeks

PanelDeskripsi panelPromQL (bahasa kueri Prometheus)Metrik Milvus yang digunakanDeskripsi metrik Milvus
Tingkat Permintaan IndeksJumlah rata-rata permintaan pembuatan indeks yang diterima per detik dalam dua menit terakhir.sum(increase(milvus_indexcoord_indexreq_count{app_kubernetes_io_instance=~"$instance", app_kubernetes_io_name="$app_name", namespace="$namespace"}[2m])/120) by (status)milvus_indexcoord_indexreq_countJumlah permintaan pembuatan indeks yang diterima.
Jumlah Tugas IndeksJumlah semua tugas pengindeksan yang dicatat dalam metadata indeks.sum(milvus_indexcoord_indextask_count{app_kubernetes_io_instance=~"$instance", app_kubernetes_io_name="$app_name", namespace="$namespace"}) by (index_task_status)milvus_indexcoord_indextask_countJumlah semua tugas pengindeksan yang dicatat dalam metadata indeks.
Jumlah Node IndeksJumlah node indeks yang dikelola.sum(milvus_indexcoord_indexnode_num{app_kubernetes_io_instance=~"$instance", app_kubernetes_io_name="$app_name", namespace="$namespace"}) by (app_kubernetes_io_instance)milvus_indexcoord_indexnode_numJumlah simpul indeks yang dikelola.

Simpul indeks

PanelDeskripsi panelPromQL (Bahasa kueri Prometheus)Metrik Milvus yang digunakanDeskripsi metrik Milvus
Tingkat Tugas IndeksJumlah rata-rata tugas pembuatan indeks yang diterima oleh setiap simpul indeks per detik dalam dua menit terakhir.sum(increase(milvus_indexnode_index_task_count{app_kubernetes_io_instance=~"$instance", app_kubernetes_io_name="$app_name", namespace="$namespace"}[2m])/120) by (status, pod, node_id)milvus_indexnode_index_task_countJumlah tugas pembuatan indeks yang diterima.
Latensi Bidang MuatLatensi rata-rata dan persentil ke-99 dari waktu yang digunakan oleh setiap simpul indeks untuk memuat data bidang segmen setiap kali dalam dua menit terakhir.p99:
histogram_quantile(0.99, sum by (le, pod, node_id) (rate(milvus_indexnode_load_field_latency_bucket{app_kubernetes_io_instance=~"$instance", app_kubernetes_io_name="$app_name", namespace="$namespace"}[2m])))
avg:
sum(increase(milvus_indexnode_load_field_latency_sum{app_kubernetes_io_instance=~"$instance", app_kubernetes_io_name="$app_name", namespace="$namespace"}[2m])) by(pod, node_id) / sum(increase(milvus_indexnode_load_field_latency_count{app_kubernetes_io_instance=~"$instance", app_kubernetes_io_name="$app_name", namespace="$namespace"}[2m])) by(pod, node_id)
milvus_indexnode_load_field_latencyWaktu yang digunakan oleh simpul indeks untuk memuat data bidang segmen.
Latensi Bidang DekodeLatensi rata-rata dan persentil ke-99 dari waktu yang digunakan oleh setiap simpul indeks untuk menyandikan data bidang setiap kali dalam dua menit terakhir.p99:
histogram_quantile(0.99, sum by (le, pod, node_id) (rate(milvus_indexnode_decode_field_latency_bucket{app_kubernetes_io_instance=~"$instance", app_kubernetes_io_name="$app_name", namespace="$namespace"}[2m])))
avg:
sum(increase(milvus_indexnode_decode_field_latency_sum{app_kubernetes_io_instance=~"$instance", app_kubernetes_io_name="$app_name", namespace="$namespace"}[2m])) by(pod, node_id) / sum(increase(milvus_indexnode_decode_field_latency_count{app_kubernetes_io_instance=~"$instance", app_kubernetes_io_name="$app_name", namespace="$namespace"}[2m])) by(pod, node_id)
milvus_indexnode_decode_field_latencyWaktu yang digunakan untuk memecahkan kode data lapangan.
Membangun Latensi IndeksLatensi rata-rata dan persentil ke-99 dari waktu yang digunakan oleh setiap simpul indeks untuk membangun indeks dalam dua menit terakhir.p99:
histogram_quantile(0.99, sum by (le, pod, node_id) (rate(milvus_indexnode_build_index_latency_bucket{app_kubernetes_io_instance=~"$instance", app_kubernetes_io_name="$app_name", namespace="$namespace"}[2m])))
avg:
sum(increase(milvus_indexnode_build_index_latency_sum{app_kubernetes_io_instance=~"$instance", app_kubernetes_io_name="$app_name", namespace="$namespace"}[2m])) by(pod, node_id) / sum(increase(milvus_indexnode_build_index_latency_count{app_kubernetes_io_instance=~"$instance", app_kubernetes_io_name="$app_name", namespace="$namespace"}[2m])) by(pod, node_id)
milvus_indexnode_build_index_latencyWaktu yang digunakan untuk membangun indeks.
Menyandikan Latensi IndeksLatensi rata-rata dan persentil ke-99 dari waktu yang digunakan oleh setiap simpul indeks untuk menyandikan file indeks dalam dua menit terakhir.p99:
histogram_quantile(0.99, sum by (le, pod, node_id) (rate(milvus_indexnode_encode_index_latency_bucket{app_kubernetes_io_instance=~"$instance", app_kubernetes_io_name="$app_name", namespace="$namespace"}[2m])))
avg:
sum(increase(milvus_indexnode_encode_index_latency_sum{app_kubernetes_io_instance=~"$instance", app_kubernetes_io_name="$app_name", namespace="$namespace"}[2m])) by(pod, node_id) / sum(increase(milvus_indexnode_encode_index_latency_count{app_kubernetes_io_instance=~"$instance", app_kubernetes_io_name="$app_name", namespace="$namespace"}[2m])) by(pod, node_id)
milvus_indexnode_encode_index_latencyWaktu yang digunakan untuk menyandikan file indeks.
Simpan Latensi IndeksLatensi rata-rata dan persentil ke-99 dari waktu yang digunakan oleh setiap simpul indeks untuk menyimpan berkas indeks dalam dua menit terakhir.p99:
histogram_quantile(0.99, sum by (le, pod, node_id) (rate(milvus_indexnode_save_index_latency_bucket{app_kubernetes_io_instance=~"$instance", app_kubernetes_io_name="$app_name", namespace="$namespace"}[2m])))
avg:
sum(increase(milvus_indexnode_save_index_latency_sum{app_kubernetes_io_instance=~"$instance", app_kubernetes_io_name="$app_name", namespace="$namespace"}[2m])) by(pod, node_id) / sum(increase(milvus_indexnode_save_index_latency_count{app_kubernetes_io_instance=~"$instance", app_kubernetes_io_name="$app_name", namespace="$namespace"}[2m])) by(pod, node_id)
milvus_indexnode_save_index_latencyWaktu yang digunakan untuk menyimpan file indeks.

Coba Milvus yang Dikelola secara Gratis

Zilliz Cloud bebas masalah, didukung oleh Milvus dan 10x lebih cepat.

Mulai
Umpan balik

Apakah halaman ini bermanfaat?