Dasbor Metrik Milvus
Milvus mengeluarkan daftar metrik deret waktu yang terperinci selama waktu berjalan. Anda dapat menggunakan Prometheus dan Grafana untuk memvisualisasikan metrik. Topik ini memperkenalkan metrik pemantauan yang ditampilkan di Dasbor Grafana Milvus.
Satuan waktu dalam topik ini adalah milidetik. Dan "persentil ke-99" dalam topik ini mengacu pada fakta bahwa 99 persen dari statistik waktu dikontrol dalam nilai tertentu.
Kami sarankan untuk membaca ikhtisar kerangka kerja pemantauan Milvus untuk memahami metrik Prometheus terlebih dahulu.
Proksi
Panel | Deskripsi panel | PromQL (bahasa kueri Prometheus) | Metrik Milvus yang digunakan | Deskripsi metrik Milvus |
---|---|---|---|---|
Tingkat Jumlah Vektor Pencarian | Jumlah rata-rata vektor yang ditanyakan per detik oleh setiap proxy dalam dua menit terakhir. | sum(increase(milvus_proxy_search_vectors_count{app_kubernetes_io_instance=~"$instance", app_kubernetes_io_name="$app_name", namespace="$namespace"}[2m])/120) by (pod, node_id) | milvus_proxy_search_vectors_count | Akumulasi jumlah vektor yang ditanyakan. |
Tingkat Jumlah Vektor Sisipan | Jumlah rata-rata vektor yang dimasukkan per detik oleh setiap proxy dalam dua menit terakhir. | sum(increase(milvus_proxy_insert_vectors_count{app_kubernetes_io_instance=~"$instance", app_kubernetes_io_name="$app_name", namespace="$namespace"}[2m])/120) by (pod, node_id) | milvus_proxy_insert_vectors_count | Jumlah akumulasi vektor yang dimasukkan. |
Latensi Pencarian | Latensi rata-rata dan persentil ke-99 dari latensi penerimaan permintaan pencarian dan kueri oleh setiap proxy dalam dua menit terakhir. | p99: histogram_quantile(0.99, sum by (le, query_type, pod, node_id) (rate(milvus_proxy_sq_latency_bucket{app_kubernetes_io_instance=~"$instance", app_kubernetes_io_name="$app_name", namespace="$namespace"}[2m]))) avg: sum(increase(milvus_proxy_sq_latency_sum{app_kubernetes_io_instance=~"$instance", app_kubernetes_io_name="$app_name", namespace="$namespace"}[2m])) by (pod, node_id, query_type) / sum(increase(milvus_proxy_sq_latency_count{app_kubernetes_io_instance=~"$instance", app_kubernetes_io_name="$app_name", namespace="$namespace"}[2m])) by (pod, node_id, query_type) | milvus_proxy_sq_latency | Latensi permintaan pencarian dan kueri. |
Latensi Pencarian Koleksi | Latensi rata-rata dan persentil ke-99 dari latensi penerimaan permintaan pencarian dan kueri ke koleksi tertentu oleh setiap proxy dalam dua menit terakhir. | p99: histogram_quantile(0.99, sum by (le, query_type, pod, node_id) (rate(milvus_proxy_collection_sq_latency_bucket{app_kubernetes_io_instance=~"$instance", app_kubernetes_io_name="$app_name", namespace="$namespace", collection_name=~"$collection"}[2m]))) avg: sum(increase(milvus_proxy_collection_sq_latency_sum{app_kubernetes_io_instance=~"$instance", app_kubernetes_io_name="$app_name", namespace="$namespace", collection_name=~"$collection"}[2m])) by (pod, node_id, query_type) / sum(increase(milvus_proxy_collection_sq_latency_count{app_kubernetes_io_instance=~"$instance", app_kubernetes_io_name="$app_name", namespace="$namespace", collection_name=~"$collection"}[2m])) by (pod, node_id, query_type) | milvus_proxy_collection_sq_latency_sum | Latensi permintaan pencarian dan kueri ke koleksi tertentu |
Latensi Mutasi | Latensi rata-rata dan persentil ke-99 dari latensi penerimaan permintaan mutasi oleh setiap proksi dalam dua menit terakhir. | p99: histogram_quantile(0.99, sum by (le, msg_type, pod, node_id) (rate(milvus_proxy_mutation_latency_bucket{app_kubernetes_io_instance=~"$instance", app_kubernetes_io_name="$app_name", namespace="$namespace"}[2m]))) avg: sum(increase(milvus_proxy_mutation_latency_sum{app_kubernetes_io_instance=~"$instance", app_kubernetes_io_name="$app_name", namespace="$namespace"}[2m])) by (pod, node_id, msg_type) / sum(increase(milvus_proxy_mutation_latency_count{app_kubernetes_io_instance=~"$instance", app_kubernetes_io_name="$app_name", namespace="$namespace"}[2m])) by (pod, node_id, msg_type) | milvus_proxy_mutation_latency_sum | Latensi permintaan mutasi. |
Latensi Mutasi Koleksi | Latensi rata-rata dan persentil ke-99 dari latensi penerimaan permintaan mutasi ke koleksi tertentu oleh setiap proxy dalam dua menit terakhir. | p99: histogram_quantile(0.99, sum by (le, query_type, pod, node_id) (rate(milvus_proxy_collection_sq_latency_bucket{app_kubernetes_io_instance=~"$instance", app_kubernetes_io_name="$app_name", namespace="$namespace", collection_name=~"$collection"}[2m]))) avg: sum(increase(milvus_proxy_collection_sq_latency_sum{app_kubernetes_io_instance=~"$instance", app_kubernetes_io_name="$app_name", namespace="$namespace", collection_name=~"$collection"}[2m])) by (pod, node_id, query_type) / sum(increase(milvus_proxy_collection_sq_latency_count{app_kubernetes_io_instance=~"$instance", app_kubernetes_io_name="$app_name", namespace="$namespace", collection_name=~"$collection"}[2m])) by (pod, node_id, query_type) | milvus_proxy_collection_sq_latency_sum | Latensi permintaan mutasi ke koleksi tertentu |
Latensi Hasil Pencarian Tunggu | Latensi rata-rata dan persentil ke-99 dari latensi antara pengiriman permintaan pencarian dan kueri dan penerimaan hasil oleh proxy dalam dua menit terakhir. | p99: histogram_quantile(0.99, sum by (le, query_type, pod, node_id) (rate(milvus_proxy_sq_wait_result_latency_bucket{app_kubernetes_io_instance=~"$instance", app_kubernetes_io_name="$app_name", namespace="$namespace"}[2m]))) avg: sum(increase(milvus_proxy_sq_wait_result_latency_sum{app_kubernetes_io_instance=~"$instance", app_kubernetes_io_name="$app_name", namespace="$namespace"}[2m])) by (pod, node_id, query_type) / sum(increase(milvus_proxy_sq_wait_result_latency_count{app_kubernetes_io_instance=~"$instance", app_kubernetes_io_name="$app_name", namespace="$namespace"}[2m])) by (pod, node_id, query_type) | milvus_proxy_sq_wait_result_latency | Latensi antara mengirim permintaan pencarian dan kueri dan menerima hasil. |
Mengurangi Latensi Hasil Pencarian | Latensi rata-rata dan persentil ke-99 dari latensi penggabungan hasil pencarian dan kueri oleh proxy dalam dua menit terakhir. | p99: histogram_quantile(0.99, sum by (le, query_type, pod, node_id) (rate(milvus_proxy_sq_reduce_result_latency_bucket{app_kubernetes_io_instance=~"$instance", app_kubernetes_io_name="$app_name", namespace="$namespace"}[2m]))) avg: sum(increase(milvus_proxy_sq_reduce_result_latency_sum{app_kubernetes_io_instance=~"$instance", app_kubernetes_io_name="$app_name", namespace="$namespace"}[2m])) by (pod, node_id, query_type) / sum(increase(milvus_proxy_sq_reduce_result_latency_count{app_kubernetes_io_instance=~"$instance", app_kubernetes_io_name="$app_name", namespace="$namespace"}[2m])) by (pod, node_id, query_type) | milvus_proxy_sq_reduce_result_latency | Latensi penggabungan hasil pencarian dan kueri yang dikembalikan oleh setiap simpul kueri. |
Menguraikan Latensi Hasil Pencarian | Latensi rata-rata dan persentil ke-99 dari latensi penguraian hasil pencarian dan kueri oleh proxy dalam dua menit terakhir. | p99: histogram_quantile(0.99, sum by (le, query_type, pod, node_id) (rate(milvus_proxy_sq_decode_result_latency_bucket{app_kubernetes_io_instance=~"$instance", app_kubernetes_io_name="$app_name", namespace="$namespace"}[2m]))) avg: sum(increase(milvus_proxy_sq_decode_result_latency_sum{app_kubernetes_io_instance=~"$instance", app_kubernetes_io_name="$app_name", namespace="$namespace"}[2m])) by (pod, node_id, query_type) / sum(increase(milvus_proxy_sq_decode_resultlatency_count{app_kubernetes_io_instance=~"$instance", app_kubernetes_io_name="$app_name", namespace="$namespace"}[2m])) by (pod, node_id, query_type) | milvus_proxy_sq_decode_result_latency | Latensi penguraian kode setiap hasil pencarian dan kueri. |
Jumlah Objek Aliran Msg | Jumlah rata-rata, maksimum, dan minimum dari objek msgstream yang dibuat oleh setiap proxy pada topik fisik yang sesuai dalam dua menit terakhir. | avg(milvus_proxy_msgstream_obj_num{app_kubernetes_io_instance=~"$instance", app_kubernetes_io_name="$app_name", namespace="$namespace"}) by (pod, node_id) max(milvus_proxy_msgstream_obj_num{app_kubernetes_io_instance=~"$instance", app_kubernetes_io_name="$app_name", namespace="$namespace"}) by (pod, node_id) min(milvus_proxy_msgstream_obj_num{app_kubernetes_io_instance=~"$instance", app_kubernetes_io_name="$app_name", namespace="$namespace"}) by (pod, node_id) | milvus_proxy_msgstream_obj_num | Jumlah objek msgstream yang dibuat pada setiap topik fisik. |
Latensi Pengiriman Mutasi | Latensi rata-rata dan persentil ke-99 dari latensi pengiriman permintaan penyisipan atau penghapusan oleh setiap proxy dalam dua menit terakhir. | p99: histogram_quantile(0.99, sum by (le, msg_type, pod, node_id) (rate(milvus_proxy_mutation_send_latency_bucket{app_kubernetes_io_instance=~"$instance", app_kubernetes_io_name="$app_name", namespace="$namespace"}[2m]))) avg: sum(increase(milvus_proxy_mutation_send_latency_sum{app_kubernetes_io_instance=~"$instance", app_kubernetes_io_name="$app_name", namespace="$namespace"}[2m])) by (pod, node_id, msg_type) / sum(increase(milvus_proxy_mutation_send_latency_count{app_kubernetes_io_instance=~"$instance", app_kubernetes_io_name="$app_name", namespace="$namespace"}[2m])) by (pod, node_id, msg_type) | milvus_proxy_mutation_send_latency | Latensi pengiriman permintaan penyisipan atau penghapusan. |
Cache Hit Rate | Tingkat hit cache rata-rata dari operasi termasuk GeCollectionID , GetCollectionInfo , dan GetCollectionSchema per detik dalam dua menit terakhir. | sum(increase(milvus_proxy_cache_hit_count{app_kubernetes_io_instance=~"$instance", app_kubernetes_io_name="$app_name", namespace="$namespace", cache_state="hit"}[2m])/120) by(cache_name, pod, node_id) / sum(increase(milvus_proxy_cache_hit_count{app_kubernetes_io_instance=~"$instance", app_kubernetes_io_name="$app_name", namespace="$namespace"}[2m])/120) by(cache_name, pod, node_id) | milvus_proxy_cache_hit_count | Statistik tingkat keberhasilan dan kegagalan setiap operasi pembacaan cache. |
Latensi Pembaruan Cache | Latensi rata-rata dan persentil ke-99 dari latensi pembaruan cache oleh proxy dalam dua menit terakhir. | p99: histogram_quantile(0.99, sum by (le, pod, node_id) (rate(milvus_proxy_cache_update_latency_bucket{app_kubernetes_io_instance=~"$instance", app_kubernetes_io_name="$app_name", namespace="$namespace"}[2m]))) avg: sum(increase(milvus_proxy_cache_update_latency_sum{app_kubernetes_io_instance=~"$instance", app_kubernetes_io_name="$app_name", namespace="$namespace"}[2m])) by (pod, node_id) / sum(increase(milvus_proxy_cache_update_latency_count{app_kubernetes_io_instance=~"$instance", app_kubernetes_io_name="$app_name", namespace="$namespace"}[2m])) by (pod, node_id) | milvus_proxy_cache_update_latency | Latensi pembaruan cache setiap kali. |
Waktu Sinkronisasi | Jumlah rata-rata, maksimum, dan minimum waktu epoch yang disinkronkan oleh setiap proxy di saluran fisik yang sesuai. | avg(milvus_proxy_sync_epoch_time{app_kubernetes_io_instance=~"$instance", app_kubernetes_io_name="$app_name", namespace="$namespace"}) by (pod, node_id) max(milvus_proxy_sync_epoch_time{app_kubernetes_io_instance=~"$instance", app_kubernetes_io_name="$app_name", namespace="$namespace"}) by (pod, node_id) min(milvus_proxy_sync_epoch_time{app_kubernetes_io_instance=~"$instance", app_kubernetes_io_name="$app_name", namespace="$namespace"}) by (pod, node_id) | milvus_proxy_sync_epoch_time | Waktu epoch setiap saluran fisik (waktu Unix, milidetik yang telah berlalu sejak 1 Januari 1970). Ada default ChannelName selain dari saluran fisik. |
Menerapkan Latensi PK | Latensi rata-rata dan persentil ke-99 dari latensi aplikasi kunci utama oleh setiap proxy dalam dua menit terakhir. | p99: histogram_quantile(0.99, sum by (le, pod, node_id) (rate(milvus_proxy_apply_pk_latency_bucket{app_kubernetes_io_instance=~"$instance", app_kubernetes_io_name="$app_name", namespace="$namespace"}[2m]))) avg: sum(increase(milvus_proxy_apply_pk_latency_sum{app_kubernetes_io_instance=~"$instance", app_kubernetes_io_name="$app_name", namespace="$namespace"}[2m])) by (pod, node_id) / sum(increase(milvus_proxy_apply_pk_latency_count{app_kubernetes_io_instance=~"$instance", app_kubernetes_io_name="$app_name", namespace="$namespace"}[2m])) by (pod, node_id) | milvus_proxy_apply_pk_latency | Latensi penerapan kunci utama. |
Menerapkan Latensi Stempel Waktu | Latensi rata-rata dan persentil ke-99 dari latensi aplikasi stempel waktu oleh setiap proxy dalam dua menit terakhir. | p99: histogram_quantile(0.99, sum by (le, pod, node_id) (rate(milvus_proxy_apply_timestamp_latency_bucket{app_kubernetes_io_instance=~"$instance", app_kubernetes_io_name="$app_name", namespace="$namespace"}[2m]))) avg: sum(increase(milvus_proxy_apply_timestamp_latency_sum{app_kubernetes_io_instance=~"$instance", app_kubernetes_io_name="$app_name", namespace="$namespace"}[2m])) by (pod, node_id) / sum(increase(milvus_proxy_apply_timestamp_latency_count{app_kubernetes_io_instance=~"$instance", app_kubernetes_io_name="$app_name", namespace="$namespace"}[2m])) by (pod, node_id) | milvus_proxy_apply_timestamp_latency | Latensi penerapan stempel waktu. |
Tingkat Keberhasilan Permintaan | Jumlah permintaan yang berhasil diterima per detik oleh setiap proxy, dengan perincian terperinci dari setiap jenis permintaan. Jenis permintaan yang mungkin adalah DescribeCollection, DescribeIndex, GetCollectionStatistics, HasCollection, Search, Query, ShowPartitions, Insert, dll. | |||
sum(increase(milvus_proxy_req_count{app_kubernetes_io_instance=~"$instance", app_kubernetes_io_name="$app_name", namespace="$namespace", status="success"}[2m])/120) by(function_name, pod, node_id) | milvus_proxy_req_count | Jumlah semua jenis permintaan yang diterima | ||
Tingkat Permintaan Gagal | Jumlah permintaan gagal yang diterima per detik oleh setiap proxy, dengan perincian terperinci dari setiap jenis permintaan. Jenis permintaan yang mungkin adalah DescribeCollection, DescribeIndex, GetCollectionStatistics, HasCollection, Search, Query, ShowPartitions, Insert, dll. | |||
sum(increase(milvus_proxy_req_count{app_kubernetes_io_instance=~"$instance", app_kubernetes_io_name="$app_name", namespace="$namespace", status="fail"}[2m])/120) by(function_name, pod, node_id) | milvus_proxy_req_count | Jumlah semua jenis permintaan yang diterima | ||
Latensi Permintaan | Latensi rata-rata dan persentil ke-99 dari latensi semua jenis permintaan yang diterima oleh setiap proxy | p99: histogram_quantile(0.99, sum by (le, pod, node_id, function_name) (rate(milvus_proxy_req_latency_bucket{app_kubernetes_io_instance=~"$instance", app_kubernetes_io_name="$app_name", namespace="$namespace"}[2m]))) avg: sum(increase(milvus_proxy_req_latency_sum{app_kubernetes_io_instance=~"$instance", app_kubernetes_io_name="$app_name", namespace="$namespace"}[2m])) by (pod, node_id, function_name) / sum(increase(milvus_proxy_req_latency_count{app_kubernetes_io_instance=~"$instance", app_kubernetes_io_name="$app_name", namespace="$namespace"}[2m])) by (pod, node_id, function_name) | milvus_proxy_req_latency | Latensi dari semua jenis permintaan penerimaan |
Tingkat Byte Permintaan Sisipkan/Hapus | Jumlah byte permintaan sisipkan dan hapus yang diterima per detik oleh proxy dalam dua menit terakhir. | sum(increase(milvus_proxy_receive_bytes_count{app_kubernetes_io_instance=~"$instance", app_kubernetes_io_name="$app_name", namespace="$namespace"}[2m])/120) by(pod, node_id) | milvus_proxy_receive_bytes_count | Jumlah permintaan sisipkan dan hapus. |
Kecepatan Pengiriman Byte | Jumlah byte per detik yang dikirim kembali ke klien ketika setiap proxy merespons permintaan pencarian dan kueri dalam dua menit terakhir. | sum(increase(milvus_proxy_send_bytes_count{app_kubernetes_io_instance=~"$instance", app_kubernetes_io_name="$app_name", namespace="$namespace"}[2m])/120) by(pod, node_id) | milvus_proxy_send_bytes_count | Jumlah byte yang dikirim kembali ke klien ketika setiap proxy merespons permintaan pencarian dan kueri. |
Koordinator root
Panel | Deskripsi panel | PromQL (bahasa kueri Prometheus) | Metrik Milvus yang digunakan | Deskripsi metrik Milvus |
---|---|---|---|---|
Jumlah Simpul Proksi | Jumlah proxy yang dibuat. | sum(milvus_rootcoord_proxy_num{app_kubernetes_io_instance=~"$instance", app_kubernetes_io_name="$app_name", namespace="$namespace"}) by (app_kubernetes_io_instance) | milvus_rootcoord_proxy_num | Jumlah proxy. |
Waktu Sinkronisasi | Jumlah rata-rata, maksimum, dan minimum waktu epoch yang disinkronkan oleh setiap koordinat root di setiap saluran fisik (PChannel). | avg(milvus_rootcoord_sync_epoch_time{app_kubernetes_io_instance=~"$instance", app_kubernetes_io_name="$app_name", namespace="$namespace"}) by (app_kubernetes_io_instance) max(milvus_rootcoord_sync_epoch_time{app_kubernetes_io_instance=~"$instance", app_kubernetes_io_name="$app_name", namespace="$namespace"}) by (app_kubernetes_io_instance) min(milvus_rootcoord_sync_epoch_time{app_kubernetes_io_instance=~"$instance", app_kubernetes_io_name="$app_name", namespace="$namespace"}) by (app_kubernetes_io_instance) | milvus_rootcoord_sync_epoch_time | Waktu epoch setiap saluran fisik (waktu Unix, milidetik yang telah berlalu sejak 1 Januari 1970). |
Tingkat Permintaan DDL | Status dan jumlah permintaan DDL per detik dalam dua menit terakhir. | sum(increase(milvus_rootcoord_ddl_req_count{app_kubernetes_io_instance=~"$instance", app_kubernetes_io_name="$app_name", namespace="$namespace"}[2m])/120) by (status, function_name) | milvus_rootcoord_ddl_req_count | Jumlah total permintaan DDL termasuk CreateCollection , DescribeCollection , DescribeSegments , HasCollection , ShowCollections , ShowPartitions , dan ShowSegments . |
Latensi Permintaan DDL | Latensi rata-rata dan persentil ke-99 latensi permintaan DDL dalam dua menit terakhir. | p99: histogram_quantile(0.99, sum by (le, function_name) (rate(milvus_rootcoord_ddl_req_latency_bucket{app_kubernetes_io_instance=~"$instance", app_kubernetes_io_name="$app_name", namespace="$namespace"}[2m]))) avg: sum(increase(milvus_rootcoord_ddl_req_latency_sum{app_kubernetes_io_instance=~"$instance", app_kubernetes_io_name="$app_name", namespace="$namespace"}[2m])) by (function_name) / sum(increase(milvus_rootcoord_ddl_req_latency_count{app_kubernetes_io_instance=~"$instance", app_kubernetes_io_name="$app_name", namespace="$namespace"}[2m])) by (function_name) | milvus_rootcoord_ddl_req_latency | Latensi semua jenis permintaan DDL. |
Latensi Timetick Sinkronisasi | Latensi rata-rata dan persentil ke-99 dari waktu yang digunakan oleh root coord untuk menyinkronkan semua cap waktu ke PChannel dalam dua menit terakhir. | p99: histogram_quantile(0.99, sum by (le) (rate(milvus_rootcoord_sync_timetick_latency_bucket{app_kubernetes_io_instance=~"$instance", app_kubernetes_io_name="$app_name", namespace="$namespace"}[2m]))) avg: sum(increase(milvus_rootcoord_sync_timetick_latency_sum{app_kubernetes_io_instance=~"$instance", app_kubernetes_io_name="$app_name", namespace="$namespace"}[2m])) / sum(increase(milvus_rootcoord_sync_timetick_latency_count{app_kubernetes_io_instance=~"$instance", app_kubernetes_io_name="$app_name", namespace="$namespace"}[2m])) | milvus_rootcoord_sync_timetick_latency | waktu yang digunakan oleh root coord untuk menyinkronkan semua cap waktu ke pchannel. |
Tingkat Alokasi ID | Jumlah ID yang diberikan oleh root coord per detik dalam dua menit terakhir. | sum(increase(milvus_rootcoord_id_alloc_count{app_kubernetes_io_instance=~"$instance", app_kubernetes_io_name="$app_name", namespace="$namespace"}[2m])/120) | milvus_rootcoord_id_alloc_count | Jumlah akumulasi ID yang diberikan oleh root coord. |
Stempel waktu | Cap waktu terbaru dari root coord. | milvus_rootcoord_timestamp{app_kubernetes_io_instance=~"$instance", app_kubernetes_io_name="$app_name", namespace="$namespace"} | milvus_rootcoord_timestamp | Cap waktu terbaru dari koordinat akar. |
Stempel Waktu Tersimpan | Stempel waktu yang telah ditetapkan sebelumnya yang disimpan oleh root coord di penyimpanan meta. | milvus_rootcoord_timestamp_saved{app_kubernetes_io_instance=~"$instance", app_kubernetes_io_name="$app_name", namespace="$namespace"} | milvus_rootcoord_timestamp_saved | Stempel waktu yang telah ditetapkan sebelumnya yang disimpan oleh root coord di penyimpanan meta. Stempel waktu ditetapkan 3 detik sebelumnya. Dan stempel waktu diperbarui dan disimpan dalam penyimpanan meta setiap 50 milidetik. |
Jumlah Koleksi | Jumlah total koleksi. | sum(milvus_rootcoord_collection_num{app_kubernetes_io_instance=~"$instance", app_kubernetes_io_name="$app_name", namespace="$namespace"}) by (app_kubernetes_io_instance) | milvus_rootcoord_collection_num | Jumlah total koleksi yang ada di Milvus saat ini. |
Partition Num | Jumlah total partisi. | sum(milvus_rootcoord_partition_num{app_kubernetes_io_instance=~"$instance", app_kubernetes_io_name="$app_name", namespace="$namespace"}) by (app_kubernetes_io_instance) | milvus_rootcoord_partition_num | Jumlah total partisi yang ada di Milvus saat ini. |
Jumlah Saluran DML | Jumlah total saluran DML. | sum(milvus_rootcoord_dml_channel_num{app_kubernetes_io_instance=~"$instance", app_kubernetes_io_name="$app_name", namespace="$namespace"}) by (app_kubernetes_io_instance) | milvus_rootcoord_dml_channel_num | Jumlah total saluran DML yang ada di Milvus saat ini. |
Msgstream Num | Jumlah total msgstream. | sum(milvus_rootcoord_msgstream_obj_num{app_kubernetes_io_instance=~"$instance", app_kubernetes_io_name="$app_name", namespace="$namespace"}) by (app_kubernetes_io_instance) | milvus_rootcoord_msgstream_obj_num | Jumlah total msgstream yang ada di Milvus saat ini. |
Jumlah Kredensial | Jumlah total kredensial. | sum(milvus_rootcoord_credential_num{app_kubernetes_io_instance=~"$instance", app_kubernetes_io_name="$app_name", namespace="$namespace"}) by (app_kubernetes_io_instance) | milvus_rootcoord_credential_num | Jumlah total kredensial di Milvus saat ini. |
Penundaan Detak Waktu | Jumlah waktu tunda tick delay maksimum dari grafik aliran pada semua DataNode dan QueryNode. | sum(milvus_rootcoord_time_tick_delay{app_kubernetes_io_instance=~"$instance", app_kubernetes_io_name="$app_name", namespace="$namespace"}) by (app_kubernetes_io_instance) | milvus_rootcoord_time_tick_delay | Waktu tunda tick delay maksimum dari grafik aliran pada setiap DataNode dan QueryNode. |
Koordinator kueri
Panel | Deskripsi panel | PromQL (bahasa kueri Prometheus) | Metrik Milvus yang digunakan | Deskripsi metrik Milvus |
---|---|---|---|---|
Jumlah Koleksi yang Dimuat | Jumlah koleksi yang saat ini dimuat ke dalam memori. | sum(milvus_querycoord_collection_num{app_kubernetes_io_instance=~"$instance", app_kubernetes_io_name="$app_name", namespace="$namespace"}) by (app_kubernetes_io_instance) | milvus_querycoord_collection_num | Jumlah koleksi yang saat ini dimuat oleh Milvus. |
Jumlah Entitas yang Dimuat | Jumlah entitas yang saat ini dimuat ke dalam memori. | sum(milvus_querycoord_entity_num{app_kubernetes_io_instance=~"$instance", app_kubernetes_io_name="$app_name", namespace="$namespace"}) by (app_kubernetes_io_instance) | milvus_querycoord_entitiy_num | Jumlah entitas yang sedang dimuat oleh Milvus. |
Tingkat Permintaan Muat | Jumlah permintaan beban per detik dalam dua menit terakhir. | sum(increase(milvus_querycoord_load_req_count{app_kubernetes_io_instance=~"$instance", app_kubernetes_io_name="$app_name", namespace="$namespace"}[2m])120) by (status) | milvus_querycoord_load_req_count | Jumlah akumulasi permintaan beban. |
Tingkat Permintaan Rilis | Jumlah permintaan rilis per detik dalam dua menit terakhir. | sum(increase(milvus_querycoord_release_req_count{app_kubernetes_io_instance=~"$instance", app_kubernetes_io_name="$app_name", namespace="$namespace"}[2m])/120) by (status) | milvus_querycoord_release_req_count | Jumlah akumulasi permintaan pelepasan. |
Latensi Permintaan Muat | Latensi rata-rata dan persentil ke-99 dari latensi permintaan muat dalam dua menit terakhir. | p99: histogram_quantile(0.99, sum by (le) (rate(milvus_querycoord_load_latency_bucket{app_kubernetes_io_instance=~"$instance", app_kubernetes_io_name="$app_name", namespace="$namespace"}[2m]))) avg: sum(increase(milvus_querycoord_load_latency_sum{app_kubernetes_io_instance=~"$instance", app_kubernetes_io_name="$app_name", namespace="$namespace"}[2m])) / sum(increase(milvus_querycoord_load_latency_count{app_kubernetes_io_instance=~"$instance", app_kubernetes_io_name="$app_name", namespace="$namespace"}[2m])) | milvus_querycoord_load_latency | Waktu yang digunakan untuk menyelesaikan permintaan muat. |
Latensi Permintaan Rilis | Latensi rata-rata dan persentil ke-99 dari latensi permintaan rilis dalam dua menit terakhir. | p99: histogram_quantile(0.99, sum by (le) (rate(milvus_querycoord_release_latency_bucket{app_kubernetes_io_instance=~"$instance", app_kubernetes_io_name="$app_name", namespace="$namespace"}[2m]))) avg: sum(increase(milvus_querycoord_release_latency_sum{app_kubernetes_io_instance=~"$instance", app_kubernetes_io_name="$app_name", namespace="$namespace"}[2m])) / sum(increase(milvus_querycoord_release_latency_count{app_kubernetes_io_instance=~"$instance", app_kubernetes_io_name="$app_name", namespace="$namespace"}[2m])) | milvus_querycoord_release_latency | Waktu yang digunakan untuk menyelesaikan permintaan pelepasan. |
Tugas Sub-Beban | Jumlah tugas sub beban. | sum(milvus_querycoord_child_task_num{app_kubernetes_io_instance=~"$instance", app_kubernetes_io_name="$app_name", namespace="$namespace"}) by (app_kubernetes_io_instance) | milvus_querycoord_child_task_num | Jumlah sub tugas beban. Sebuah koordinat kueri membagi permintaan muat menjadi beberapa sub tugas muat. |
Tugas Beban Induk | Jumlah tugas beban induk. | sum(milvus_querycoord_parent_task_num{app_kubernetes_io_instance=~"$instance", app_kubernetes_io_name="$app_name", namespace="$namespace"}) by (app_kubernetes_io_instance) | milvus_querycoord_parent_task_num | Jumlah sub tugas beban. Setiap permintaan beban berhubungan dengan tugas induk dalam antrean tugas. |
Latensi Tugas Sub-Memuat | Latensi rata-rata dan persentil ke-99 dari latensi tugas sub-muat dalam dua menit terakhir. | p99: histogram_quantile(0.99, sum by (le) (rate(milvus_querycoord_child_task_latency_bucket{app_kubernetes_io_instance=~"$instance", app_kubernetes_io_name="$app_name", namespace="$namespace"}[2m]))) avg: sum(increase(milvus_querycoord_child_task_latency_sum{app_kubernetes_io_instance=~"$instance", app_kubernetes_io_name="$app_name", namespace="$namespace"}[2m])) / sum(increase(milvus_querycoord_child_task_latency_count{app_kubernetes_io_instance=~"$instance", app_kubernetes_io_name="$app_name", namespace="$namespace"}[2m])) namespace"}[2m]))) | milvus_querycoord_child_task_latency | Latensi untuk menyelesaikan tugas sub-beban. |
Jumlah Node Kueri | Jumlah node kueri yang dikelola oleh koordinat kueri. | sum(milvus_querycoord_querynode_num{app_kubernetes_io_instance=~"$instance", app_kubernetes_io_name="$app_name", namespace="$namespace"}) by (app_kubernetes_io_instance) | milvus_querycoord_querynode_num | Jumlah node kueri yang dikelola oleh koordinat kueri. |
Node kueri
Panel | Deskripsi panel | PromQL (bahasa kueri Prometheus) | Metrik Milvus yang digunakan | Deskripsi metrik Milvus |
---|---|---|---|---|
Jumlah Koleksi yang Dimuat | Jumlah koleksi yang dimuat ke dalam memori oleh setiap simpul kueri. | sum(milvus_querynode_collection_num{app_kubernetes_io_instance=~"$instance", app_kubernetes_io_name="$app_name", namespace="$namespace"}) by (pod, node_id) | milvus_querynode_collection_num | Jumlah koleksi yang dimuat oleh setiap node kueri. |
Partition Loaded Num | Jumlah partisi yang dimuat ke dalam memori oleh setiap simpul kueri. | sum(milvus_querynode_partition_num{app_kubernetes_io_instance=~"$instance", app_kubernetes_io_name="$app_name", namespace="$namespace"}) by (pod, node_id) | milvus_querynode_partition_num | Jumlah partisi yang dimuat oleh setiap simpul kueri. |
Segmen Dimuat Num | Jumlah segmen yang dimuat ke dalam memori oleh setiap node kueri. | sum(milvus_querynode_segment_num{app_kubernetes_io_instance=~"$instance", app_kubernetes_io_name="$app_name", namespace="$namespace"}) by (pod, node_id) | milvus_querynode_segment_num | Jumlah segmen yang dimuat oleh setiap node kueri. |
Jumlah Entitas yang Dapat Diperoleh | Jumlah entitas yang dapat ditanyakan dan dicari pada setiap node kueri. | sum(milvus_querynode_entity_num{app_kubernetes_io_instance=~"$instance", app_kubernetes_io_name="$app_name", namespace="$namespace"}) by (pod, node_id) | milvus_querynode_entity_num | Jumlah entitas yang dapat di-query dan dapat dicari pada setiap node kueri. |
Saluran Virtual DML | Jumlah saluran virtual DML yang ditonton oleh setiap node kueri. | sum(milvus_querynode_dml_vchannel_num{app_kubernetes_io_instance=~"$instance", app_kubernetes_io_name="$app_name", namespace="$namespace"}) by (pod, node_id) | milvus_querynode_dml_vchannel_num | Jumlah saluran virtual DML yang ditonton oleh setiap node kueri. |
Saluran Virtual Delta | Jumlah saluran delta yang ditonton oleh setiap node kueri. | sum(milvus_querynode_delta_vchannel_num{app_kubernetes_io_instance=~"$instance", app_kubernetes_io_name="$app_name", namespace="$namespace"}) by (pod, node_id) | milvus_querynode_delta_vchannel_num | Jumlah saluran delta yang ditonton oleh setiap node kueri. |
Jumlah Konsumen | Jumlah konsumen di setiap node kueri. | sum(milvus_querynode_consumer_num{app_kubernetes_io_instance=~"$instance", app_kubernetes_io_name="$app_name", namespace="$namespace"}) by (pod, node_id) | milvus_querynode_consumer_num | Jumlah konsumen di setiap node kueri. |
Tingkat Permintaan Pencarian | Jumlah total permintaan pencarian dan permintaan kueri yang diterima per detik oleh setiap node kueri dan jumlah permintaan pencarian dan permintaan kueri yang berhasil dalam dua menit terakhir. | sum(increase(milvus_querynode_sq_req_count{app_kubernetes_io_instance=~"$instance", app_kubernetes_io_name="$app_name", namespace="$namespace"}[2m])/120) by (query_type, status, pod, node_id) | milvus_querynode_sq_req_count | Jumlah akumulasi permintaan pencarian dan permintaan kueri. |
Latensi Permintaan Pencarian | Latensi rata-rata dan persentil ke-99 dari waktu yang digunakan dalam permintaan pencarian dan permintaan kueri oleh setiap node kueri dalam dua menit terakhir. Panel ini menampilkan latensi permintaan pencarian dan permintaan kueri yang berstatus "sukses" atau "total". | p99: histogram_quantile(0.99, sum by (le, pod, node_id) (rate(milvus_querynode_sq_req_latency_bucket{app_kubernetes_io_instance=~"$instance", app_kubernetes_io_name="$app_name", namespace="$namespace"}[2m]))) avg: sum(increase(milvus_querynode_sq_req_latency_sum{app_kubernetes_io_instance=~"$instance", app_kubernetes_io_name="$app_name", namespace="$namespace"}[2m])) by(pod, node_id, query_type) / sum(increase(milvus_querynode_sq_req_latency_count{app_kubernetes_io_instance=~"$instance", app_kubernetes_io_name="$app_name", namespace="$namespace"}[2m])) by(pod, node_id, query_type) | milvus_querynode_sq_req_latency | Latensi permintaan pencarian dari simpul kueri. |
Pencarian dalam Latensi Antrian | Latensi rata-rata dan persentil ke-99 dari latensi permintaan pencarian dan kueri dalam antrean dalam dua menit terakhir. | p99: histogram_quantile(0.99, sum by (le, pod, node_id, query_type) (rate(milvus_querynode_sq_queue_latency_bucket{app_kubernetes_io_instance=~"$instance", app_kubernetes_io_name="$app_name", namespace="$namespace"}[2m]))) avg: sum(increase(milvus_querynode_sq_queue_latency_sum{app_kubernetes_io_instance=~"$instance", app_kubernetes_io_name="$app_name", namespace="$namespace"}[2m])) by(pod, node_id, query_type) / sum(increase(milvus_querynode_sq_queue_latency_count{app_kubernetes_io_instance=~"$instance", app_kubernetes_io_name="$app_name", namespace="$namespace"}[2m])) by(pod, node_id, query_type) | milvus_querynode_sq_queue_latency | Latensi permintaan pencarian dan kueri yang diterima oleh simpul kueri. |
Latensi Segmen Pencarian | Latensi rata-rata dan persentil ke-99 dari waktu yang dibutuhkan setiap node kueri untuk mencari dan meminta segmen dalam dua menit terakhir. Status segmen dapat disegel atau berkembang. | p99: histogram_quantile(0.99, sum by (le, query_type, segment_state, pod, node_id) (rate(milvus_querynode_sq_segment_latency_bucket{app_kubernetes_io_instance=~"$instance", app_kubernetes_io_name="$app_name", namespace="$namespace"}[2m]))) avg: sum(increase(milvus_querynode_sq_segment_latency_sum{app_kubernetes_io_instance=~"$instance", app_kubernetes_io_name="$app_name", namespace="$namespace"}[2m])) by(pod, node_id, query_type, segment_state) / sum(increase(milvus_querynode_sq_segment_latency_count{app_kubernetes_io_instance=~"$instance", app_kubernetes_io_name="$app_name", namespace="$namespace"}[2m])) by(pod, node_id, query_type, segment_state) | milvus_querynode_sq_segment_latency | Waktu yang dibutuhkan setiap simpul kueri untuk mencari dan menanyakan setiap segmen. |
Latensi Permintaan Segmen | Latensi rata-rata dan persentil ke-99 dari waktu yang dibutuhkan setiap simpul kueri untuk mencari dan meminta di segcore dalam dua menit terakhir. | p99: histogram_quantile(0.99, sum by (le, query_type, pod, node_id) (rate(milvus_querynode_sq_core_latency_bucket{app_kubernetes_io_instance=~"$instance", app_kubernetes_io_name="$app_name", namespace="$namespace"}[2m]))) avg: sum(increase(milvus_querynode_sq_core_latency_sum{app_kubernetes_io_instance=~"$instance", app_kubernetes_io_name="$app_name", namespace="$namespace"}[2m])) by(pod, node_id, query_type) / sum(increase(milvus_querynode_sq_core_latency_count{app_kubernetes_io_instance=~"$instance", app_kubernetes_io_name="$app_name", namespace="$namespace"}[2m])) by(pod, node_id, query_type) | milvus_querynode_sq_core_latency | Waktu yang dibutuhkan setiap simpul kueri untuk mencari dan membuat kueri dalam segcore. |
Pencarian Mengurangi Latensi | Latensi rata-rata dan persentil ke-99 dari waktu yang digunakan oleh setiap node kueri selama tahap pengurangan pencarian atau kueri dalam dua menit terakhir. | p99: histogram_quantile(0.99, sum by (le, pod, node_id, query_type) (rate(milvus_querynode_sq_reduce_latency_bucket{app_kubernetes_io_instance=~"$instance", app_kubernetes_io_name="$app_name", namespace="$namespace"}[2m]))) avg: sum(increase(milvus_querynode_sq_reduce_latency_sum{app_kubernetes_io_instance=~"$instance", app_kubernetes_io_name="$app_name", namespace="$namespace"}[2m])) by(pod, node_id, query_type) / sum(increase(milvus_querynode_sq_reduce_latency_count{app_kubernetes_io_instance=~"$instance", app_kubernetes_io_name="$app_name", namespace="$namespace"}[2m])) by(pod, node_id, query_type) | milvus_querynode_sq_reduce_latency | Waktu yang dihabiskan setiap kueri selama tahap pengurangan. |
Latensi Segmen Muat | Latensi rata-rata dan persentil ke-99 dari waktu yang dibutuhkan setiap simpul kueri untuk memuat segmen dalam dua menit terakhir. | p99: histogram_quantile(0.99, sum by (le, pod, node_id) (rate(milvus_querynode_load_segment_latency_bucket{app_kubernetes_io_instance=~"$instance", app_kubernetes_io_name="$app_name", namespace="$namespace"}[2m]))) avg: sum(increase(milvus_querynode_load_segment_latency_sum{app_kubernetes_io_instance=~"$instance", app_kubernetes_io_name="$app_name", namespace="$namespace"}[2m])) by(pod, node_id) / sum(increase(milvus_querynode_load_segment_latency_count{app_kubernetes_io_instance=~"$instance", app_kubernetes_io_name="$app_name", namespace="$namespace"}[2m])) by(pod, node_id) | milvus_querynode_load_segment_latency_bucket | Waktu yang dibutuhkan setiap simpul kueri untuk memuat sebuah segmen. |
Jumlah Flowgraph | Jumlah flowgraph di setiap node kueri. | sum(milvus_querynode_flowgraph_num{app_kubernetes_io_instance=~"$instance", app_kubernetes_io_name="$app_name", namespace="$namespace"}) by (pod, node_id) | milvus_querynode_flowgraph_num | Jumlah flowgraph di setiap node kueri. |
Panjang Tugas Baca yang Belum Terpecahkan | Panjang antrean permintaan baca yang belum terselesaikan di setiap node kueri. | sum(milvus_querynode_read_task_unsolved_len{app_kubernetes_io_instance=~"$instance", app_kubernetes_io_name="$app_name", namespace="$namespace"}) by (pod, node_id) | milvus_querynode_read_task_unsolved_len | Panjang antrean permintaan baca yang belum terpecahkan. |
Panjang Tugas Baca Siap | Panjang antrian permintaan baca yang akan dieksekusi di setiap node kueri. | sum(milvus_querynode_read_task_ready_len{app_kubernetes_io_instance=~"$instance", app_kubernetes_io_name="$app_name", namespace="$namespace"}) by (pod, node_id) | milvus_querynode_read_task_ready_len | Panjang antrean permintaan baca yang akan dieksekusi. |
Jumlah Tugas Baca Paralel | Jumlah permintaan baca bersamaan yang sedang dieksekusi di setiap node kueri. | sum(milvus_querynode_read_task_concurrency{app_kubernetes_io_instance=~"$instance", app_kubernetes_io_name="$app_name", namespace="$namespace"}) by (pod, node_id) | milvus_querynode_read_task_concurrency | Jumlah permintaan baca bersamaan yang sedang dieksekusi. |
Perkirakan Penggunaan CPU | Penggunaan CPU oleh setiap node kueri yang diperkirakan oleh penjadwal. | sum(milvus_querynode_estimate_cpu_usage{app_kubernetes_io_instance=~"$instance", app_kubernetes_io_name="$app_name", namespace="$namespace"}) by (pod, node_id) | milvus_querynode_estimate_cpu_usage | Penggunaan CPU oleh setiap node kueri yang diperkirakan oleh penjadwal. Bila nilainya 100, ini berarti seluruh CPU virtual (vCPU) digunakan. |
Ukuran Grup Pencarian | Jumlah rata-rata dan persentil ke-99 dari ukuran grup pencarian (yaitu jumlah total permintaan pencarian asli dalam permintaan pencarian gabungan yang dieksekusi oleh setiap node kueri) dalam dua menit terakhir. | p99: histogram_quantile(0.99, sum by (le, pod, node_id) (rate(milvus_querynode_search_group_size_bucket{app_kubernetes_io_instance=~"$instance", app_kubernetes_io_name="$app_name", namespace="$namespace"}[2m]))) avg: sum(increase(milvus_querynode_search_group_size_sum{app_kubernetes_io_instance=~"$instance", app_kubernetes_io_name="$app_name", namespace="$namespace"}[2m])) by(pod, node_id) / sum(increase(milvus_querynode_search_group_size_count{app_kubernetes_io_instance=~"$instance", app_kubernetes_io_name="$app_name", namespace="$namespace"}[2m])) by(pod, node_id) | milvus_querynode_load_segment_latency_bucket | Jumlah tugas pencarian asli di antara tugas pencarian gabungan dari bucket yang berbeda (yaitu Ukuran grup pencarian). |
Pencarian NQ | Jumlah rata-rata dan persentil ke-99 dari jumlah kueri (NQ) yang dilakukan saat setiap simpul kueri mengeksekusi permintaan pencarian dalam dua menit terakhir. | p99: histogram_quantile(0.99, sum by (le, pod, node_id) (rate(milvus_querynode_search_group_size_bucket{app_kubernetes_io_instance=~"$instance", app_kubernetes_io_name="$app_name", namespace="$namespace"}[2m]))) avg: sum(increase(milvus_querynode_search_group_size_sum{app_kubernetes_io_instance=~"$instance", app_kubernetes_io_name="$app_name", namespace="$namespace"}[2m])) by(pod, node_id) / sum(increase(milvus_querynode_search_group_size_count{app_kubernetes_io_instance=~"$instance", app_kubernetes_io_name="$app_name", namespace="$namespace"}[2m])) by(pod, node_id) | milvus_querynode_load_segment_latency_bucket | Jumlah kueri (NQ) permintaan pencarian. |
NQ Grup Pencarian | Jumlah rata-rata dan persentil ke-99 dari NQ permintaan pencarian yang digabungkan dan dieksekusi oleh setiap simpul kueri dalam dua menit terakhir. | p99: histogram_quantile(0.99, sum by (le, pod, node_id) (rate(milvus_querynode_search_group_nq_bucket{app_kubernetes_io_instance=~"$instance", app_kubernetes_io_name="$app_name", namespace="$namespace"}[2m]))) avg: sum(increase(milvus_querynode_search_group_nq_sum{app_kubernetes_io_instance=~"$instance", app_kubernetes_io_name="$app_name", namespace="$namespace"}[2m])) by(pod, node_id) / sum(increase(milvus_querynode_search_group_nq_count{app_kubernetes_io_instance=~"$instance", app_kubernetes_io_name="$app_name", namespace="$namespace"}[2m])) by(pod, node_id) | milvus_querynode_load_segment_latency_bucket | NQ permintaan pencarian yang digabungkan dari berbagai bucket. |
Pencarian Top_K | Jumlah rata-rata dan persentil ke-99 dari Top_K permintaan pencarian yang dieksekusi oleh setiap simpul kueri dalam dua menit terakhir. | p99: histogram_quantile(0.99, sum by (le, pod, node_id) (rate(milvus_querynode_search_topk_bucket{app_kubernetes_io_instance=~"$instance", app_kubernetes_io_name="$app_name", namespace="$namespace"}[2m]))) avg: sum(increase(milvus_querynode_search_topk_sum{app_kubernetes_io_instance=~"$instance", app_kubernetes_io_name="$app_name", namespace="$namespace"}[2m])) by(pod, node_id) / sum(increase(milvus_querynode_search_topk_count{app_kubernetes_io_instance=~"$instance", app_kubernetes_io_name="$app_name", namespace="$namespace"}[2m])) by(pod, node_id) | milvus_querynode_load_segment_latency_bucket | Jumlah Top_K permintaan pencarian. |
Kelompok Pencarian Top_K | Jumlah rata-rata dan persentil ke-99 dari Top_K permintaan pencarian yang digabungkan dan dieksekusi oleh setiap simpul kueri dalam dua menit terakhir. | p99: histogram_quantile(0.99, sum by (le, pod, node_id) (rate(milvus_querynode_search_group_topk_bucket{app_kubernetes_io_instance=~"$instance", app_kubernetes_io_name="$app_name", namespace="$namespace"}[2m]))) avg: sum(increase(milvus_querynode_search_group_topk_sum{app_kubernetes_io_instance=~"$instance", app_kubernetes_io_name="$app_name", namespace="$namespace"}[2m])) by(pod, node_id) / sum(increase(milvus_querynode_search_group_topk_count{app_kubernetes_io_instance=~"$instance", app_kubernetes_io_name="$app_name", namespace="$namespace"}[2m])) by(pod, node_id) | milvus_querynode_load_segment_latency_bucket | Jumlah Top_K permintaan pencarian yang digabungkan dari berbagai bucket. |
Tingkat Permintaan Baca yang Digusur | Jumlah permintaan baca yang digusur per detik oleh setiap simpul kueri dalam dua menit terakhir. | sum(increase(milvus_querynode_read_evicted_count{app_kubernetes_io_instance=~"$instance", app_kubernetes_io_name="$app_name", namespace="$namespace"}[2m])/120) by (pod, node_id) | milvus_querynode_sq_req_count | Jumlah akumulasi permintaan baca yang digusur oleh simpul kueri karena pembatasan lalu lintas. |
Koordinator data
Panel | Deskripsi panel | PromQL (bahasa kueri Prometheus) | Metrik Milvus yang digunakan | Deskripsi metrik Milvus |
---|---|---|---|---|
Data Node Num | Jumlah node data yang dikelola oleh koordinat data. | sum(milvus_datacoord_datanode_num{app_kubernetes_io_instance=~"$instance", app_kubernetes_io_name="$app_name", namespace="$namespace"}) by (app_kubernetes_io_instance) | milvus_datacoord_datanode_num | Jumlah node data yang dikelola oleh koordinat data. |
Jumlah Segmen | Jumlah semua jenis segmen yang dicatat dalam metadata oleh koordin data. | sum(milvus_datacoord_segment_num{app_kubernetes_io_instance=~"$instance", app_kubernetes_io_name="$app_name", namespace="$namespace"}) by (segment_state) | milvus_datacoord_segment_num | Jumlah semua jenis segmen yang dicatat dalam metadata menurut koordinat data. Jenis-jenis segmen meliputi: jatuh, disiram, disiram, tumbuh, dan disegel. |
Jumlah Koleksi | Jumlah koleksi yang tercatat dalam metadata menurut koordinat data. | sum(milvus_datacoord_collection_num{app_kubernetes_io_instance=~"$instance", app_kubernetes_io_name="$app_name", namespace="$namespace"}) by (app_kubernetes_io_instance) | milvus_datacoord_collection_num | Jumlah koleksi yang dicatat dalam metadata menurut koordinat data. |
Baris Tersimpan | Jumlah akumulasi baris data yang valid dan dibuang dalam koordinat data. | sum(milvus_datacoord_stored_rows_num{app_kubernetes_io_instance=~"$instance", app_kubernetes_io_name="$app_name", namespace="$namespace"}) by (app_kubernetes_io_instance) | milvus_datacoord_stored_rows_num | Jumlah akumulasi baris data yang valid dan dibuang dalam koordinat data. |
Tingkat Baris Tersimpan | Jumlah rata-rata baris yang di-flush per detik dalam dua menit terakhir. | sum(increase(milvus_datacoord_stored_rows_count{app_kubernetes_io_instance=~"$instance", app_kubernetes_io_name="$app_name", namespace="$namespace"}[2m])/120) by (pod, node_id) | milvus_datacoord_stored_rows_count | Akumulasi jumlah baris yang di-flush oleh koordinat data. |
Waktu Sinkronisasi | Jumlah rata-rata, maksimum, dan minimum waktu epoch yang disinkronkan oleh koordin data di setiap saluran fisik. | avg(milvus_datacoord_sync_epoch_time{app_kubernetes_io_instance=~"$instance", app_kubernetes_io_name="$app_name", namespace="$namespace"}) by (app_kubernetes_io_instance) max(milvus_datacoord_sync_epoch_time{app_kubernetes_io_instance=~"$instance", app_kubernetes_io_name="$app_name", namespace="$namespace"}) by (app_kubernetes_io_instance) min(milvus_datacoord_sync_epoch_time{app_kubernetes_io_instance=~"$instance", app_kubernetes_io_name="$app_name", namespace="$namespace"}) by (app_kubernetes_io_instance) | milvus_datacoord_sync_epoch_time | Waktu epoch setiap saluran fisik (waktu Unix, milidetik yang telah berlalu sejak 1 Januari 1970). |
Ukuran Binlog yang Disimpan | Ukuran total binlog yang disimpan. | sum(milvus_datacoord_stored_binlog_size{app_kubernetes_io_instance=~"$instance", app_kubernetes_io_name="$app_name", namespace="$namespace"}) by (app_kubernetes_io_instance) | milvus_datacoord_stored_binlog_size | Ukuran total binlog yang tersimpan dalam Milvus. |
Simpul data
Panel | Deskripsi panel | PromQL (bahasa kueri Prometheus) | Metrik Milvus yang digunakan | Deskripsi metrik Milvus |
---|---|---|---|---|
Flowgraph Num | Jumlah objek flowgraph yang berhubungan dengan setiap node data. | sum(milvus_datanode_flowgraph_num{app_kubernetes_io_instance=~"$instance", app_kubernetes_io_name="$app_name", namespace="$namespace"}) by (pod, node_id) | milvus_datanode_flowgraph_num | Jumlah objek flowgraph. Setiap pecahan dalam koleksi berhubungan dengan objek flowgraph. |
Tingkat Konsumsi Baris Msg | Jumlah baris pesan streaming yang dikonsumsi per detik oleh setiap simpul data dalam dua menit terakhir. | sum(increase(milvus_datanode_msg_rows_count{app_kubernetes_io_instance=~"$instance", app_kubernetes_io_name="$app_name", namespace="$namespace"}[2m])/120) by (msg_type, pod, node_id) | milvus_datanode_msg_rows_count | Jumlah baris pesan streaming yang dikonsumsi. Saat ini, pesan streaming yang dihitung oleh simpul data hanya mencakup pesan penyisipan dan penghapusan. |
Tingkat Ukuran Data Flush | Ukuran setiap pesan yang dibilas yang direkam per detik oleh setiap simpul data dalam dua menit terakhir. | sum(increase(milvus_datanode_flushed_data_size{app_kubernetes_io_instance=~"$instance", app_kubernetes_io_name="$app_name", namespace="$namespace"}[2m])/120) by (msg_type, pod, node_id) | milvus_datanode_flushed_data_size | Ukuran dari setiap pesan yang dibilas. Saat ini, pesan streaming yang dihitung oleh simpul data hanya mencakup pesan penyisipan dan penghapusan. |
Jumlah Konsumen | Jumlah konsumen yang dibuat pada setiap simpul data. | sum(milvus_datanode_consumer_num{app_kubernetes_io_instance=~"$instance", app_kubernetes_io_name="$app_name", namespace="$namespace"}) by (pod, node_id) | milvus_datanode_consumer_num | Jumlah konsumen yang dibuat pada setiap simpul data. Setiap diagram alir berhubungan dengan sebuah konsumen. |
Producer Num | Jumlah produsen yang dibuat pada setiap simpul data. | sum(milvus_datanode_producer_num{app_kubernetes_io_instance=~"$instance", app_kubernetes_io_name="$app_name", namespace="$namespace"}) by (pod, node_id) | milvus_datanode_producer_num | Jumlah konsumen yang dibuat pada setiap simpul data. Setiap pecahan dalam sebuah koleksi berhubungan dengan produsen saluran delta dan produsen saluran timetick. |
Waktu Sinkronisasi | Jumlah rata-rata, maksimum, dan minimum waktu epoch yang disinkronkan oleh setiap simpul data di semua topik fisik. | avg(milvus_datanode_sync_epoch_time{app_kubernetes_io_instance=~"$instance", app_kubernetes_io_name="$app_name", namespace="$namespace"}) by (pod, node_id) max(milvus_datanode_sync_epoch_time{app_kubernetes_io_instance=~"$instance", app_kubernetes_io_name="$app_name", namespace="$namespace"}) by (pod, node_id) min(milvus_datanode_sync_epoch_time{app_kubernetes_io_instance=~"$instance", app_kubernetes_io_name="$app_name", namespace="$namespace"}) by (pod, node_id) | milvus_datanode_sync_epoch_time | Waktu epoch (waktu Unix, milidetik yang telah berlalu sejak 1 Januari 1970.) dari setiap topik fisik pada simpul data. |
Jumlah Segmen yang Tidak Dibilas | Jumlah segmen yang tidak di-flush yang dibuat pada setiap simpul data. | sum(milvus_datanode_unflushed_segment_num{app_kubernetes_io_instance=~"$instance", app_kubernetes_io_name="$app_name", namespace="$namespace"}) by (pod, node_id) | milvus_datanode_unflushed_segment_num | Jumlah segmen yang tidak di-flush yang dibuat pada setiap simpul data. |
Latensi Penyandian Buffer Encode | Latensi rata-rata dan persentil ke-99 dari waktu yang digunakan untuk meng-encode buffer oleh setiap simpul data dalam dua menit terakhir. | p99: histogram_quantile(0.99, sum by (le, pod, node_id) (rate(milvus_datanode_encode_buffer_latency_bucket{app_kubernetes_io_instance=~"$instance", app_kubernetes_io_name="$app_name", namespace="$namespace"}[2m]))) avg: sum(increase(milvus_datanode_encode_buffer_latency_sum{app_kubernetes_io_instance=~"$instance", app_kubernetes_io_name="$app_name", namespace="$namespace"}[2m])) by(pod, node_id) / sum(increase(milvus_datanode_encode_buffer_latency_count{app_kubernetes_io_instance=~"$instance", app_kubernetes_io_name="$app_name", namespace="$namespace"}[2m])) by(pod, node_id) | milvus_datanode_encode_buffer_latency | Waktu yang dibutuhkan setiap simpul data untuk menyandikan buffer. |
Menyimpan Latensi Data | Latensi rata-rata dan persentil ke-99 dari waktu yang digunakan untuk menulis buffer ke dalam lapisan penyimpanan oleh setiap node data dalam dua menit terakhir. | p99: histogram_quantile(0.99, sum by (le, pod, node_id) (rate(milvus_datanode_save_latency_bucket{app_kubernetes_io_instance=~"$instance", app_kubernetes_io_name="$app_name", namespace="$namespace"}[2m]))) avg: sum(increase(milvus_datanode_save_latency_sum{app_kubernetes_io_instance=~"$instance", app_kubernetes_io_name="$app_name", namespace="$namespace"}[2m])) by(pod, node_id) / sum(increase(milvus_datanode_save_latency_count{app_kubernetes_io_instance=~"$instance", app_kubernetes_io_name="$app_name", namespace="$namespace"}[2m])) by(pod, node_id) | milvus_datanode_save_latency | Waktu yang dibutuhkan setiap simpul data untuk menulis buffer ke dalam lapisan penyimpanan. |
Laju Pengoperasian Flush (Flush Operate Rate) | Berapa kali setiap simpul data mengosongkan buffer per detik dalam dua menit terakhir. | sum(increase(milvus_datanode_flush_buffer_op_count{app_kubernetes_io_instance=~"$instance", app_kubernetes_io_name="$app_name", namespace="$namespace"}[2m])/120) by (status, pod, node_id) | milvus_datanode_flush_buffer_op_count | Jumlah akumulasi berapa kali simpul data mengisi buffer. |
Tingkat Pengoperasian Flush Otomatis | Berapa kali setiap simpul data secara otomatis mengisi buffer per detik dalam dua menit terakhir. | sum(increase(milvus_datanode_autoflush_buffer_op_count{app_kubernetes_io_instance=~"$instance", app_kubernetes_io_name="$app_name", namespace="$namespace"}[2m])/120) by (status, pod, node_id) | milvus_datanode_autoflush_buffer_op_count | Jumlah akumulasi berapa kali simpul data melakukan flushing otomatis pada buffer. |
Tingkat Permintaan Flush | Berapa kali setiap simpul data menerima permintaan flush buffer per detik dalam dua menit terakhir. | sum(increase(milvus_datanode_flush_req_count{app_kubernetes_io_instance=~"$instance", app_kubernetes_io_name="$app_name", namespace="$namespace"}[2m])/120) by (status, pod, node_id) | milvus_datanode_flush_req_count | Jumlah akumulasi berapa kali node data menerima permintaan flush dari koordinat data. |
Latensi Pemadatan | Latensi rata-rata dan persentil 99 dari waktu yang dibutuhkan setiap node data untuk menjalankan tugas pemadatan dalam dua menit terakhir. | p99: histogram_quantile(0.99, sum by (le, pod, node_id) (rate(milvus_datanode_compaction_latency_bucket{app_kubernetes_io_instance=~"$instance", app_kubernetes_io_name="$app_name", namespace="$namespace"}[2m]))) avg: sum(increase(milvus_datanode_compaction_latency_sum{app_kubernetes_io_instance=~"$instance", app_kubernetes_io_name="$app_name", namespace="$namespace"}[2m])) by(pod, node_id) / sum(increase(milvus_datanode_compaction_latency_count{app_kubernetes_io_instance=~"$instance", app_kubernetes_io_name="$app_name", namespace="$namespace"}[2m])) by(pod, node_id) | milvus_datanode_compaction_latency | Waktu yang dibutuhkan setiap simpul data untuk menjalankan tugas pemadatan. |
Koordinator indeks
Panel | Deskripsi panel | PromQL (bahasa kueri Prometheus) | Metrik Milvus yang digunakan | Deskripsi metrik Milvus |
---|---|---|---|---|
Tingkat Permintaan Indeks | Jumlah rata-rata permintaan pembuatan indeks yang diterima per detik dalam dua menit terakhir. | sum(increase(milvus_indexcoord_indexreq_count{app_kubernetes_io_instance=~"$instance", app_kubernetes_io_name="$app_name", namespace="$namespace"}[2m])/120) by (status) | milvus_indexcoord_indexreq_count | Jumlah permintaan pembuatan indeks yang diterima. |
Jumlah Tugas Indeks | Jumlah semua tugas pengindeksan yang dicatat dalam metadata indeks. | sum(milvus_indexcoord_indextask_count{app_kubernetes_io_instance=~"$instance", app_kubernetes_io_name="$app_name", namespace="$namespace"}) by (index_task_status) | milvus_indexcoord_indextask_count | Jumlah semua tugas pengindeksan yang dicatat dalam metadata indeks. |
Jumlah Node Indeks | Jumlah node indeks yang dikelola. | sum(milvus_indexcoord_indexnode_num{app_kubernetes_io_instance=~"$instance", app_kubernetes_io_name="$app_name", namespace="$namespace"}) by (app_kubernetes_io_instance) | milvus_indexcoord_indexnode_num | Jumlah simpul indeks yang dikelola. |
Simpul indeks
Panel | Deskripsi panel | PromQL (Bahasa kueri Prometheus) | Metrik Milvus yang digunakan | Deskripsi metrik Milvus |
---|---|---|---|---|
Tingkat Tugas Indeks | Jumlah rata-rata tugas pembuatan indeks yang diterima oleh setiap simpul indeks per detik dalam dua menit terakhir. | sum(increase(milvus_indexnode_index_task_count{app_kubernetes_io_instance=~"$instance", app_kubernetes_io_name="$app_name", namespace="$namespace"}[2m])/120) by (status, pod, node_id) | milvus_indexnode_index_task_count | Jumlah tugas pembuatan indeks yang diterima. |
Latensi Bidang Muat | Latensi rata-rata dan persentil ke-99 dari waktu yang digunakan oleh setiap simpul indeks untuk memuat data bidang segmen setiap kali dalam dua menit terakhir. | p99: histogram_quantile(0.99, sum by (le, pod, node_id) (rate(milvus_indexnode_load_field_latency_bucket{app_kubernetes_io_instance=~"$instance", app_kubernetes_io_name="$app_name", namespace="$namespace"}[2m]))) avg: sum(increase(milvus_indexnode_load_field_latency_sum{app_kubernetes_io_instance=~"$instance", app_kubernetes_io_name="$app_name", namespace="$namespace"}[2m])) by(pod, node_id) / sum(increase(milvus_indexnode_load_field_latency_count{app_kubernetes_io_instance=~"$instance", app_kubernetes_io_name="$app_name", namespace="$namespace"}[2m])) by(pod, node_id) | milvus_indexnode_load_field_latency | Waktu yang digunakan oleh simpul indeks untuk memuat data bidang segmen. |
Latensi Bidang Dekode | Latensi rata-rata dan persentil ke-99 dari waktu yang digunakan oleh setiap simpul indeks untuk menyandikan data bidang setiap kali dalam dua menit terakhir. | p99: histogram_quantile(0.99, sum by (le, pod, node_id) (rate(milvus_indexnode_decode_field_latency_bucket{app_kubernetes_io_instance=~"$instance", app_kubernetes_io_name="$app_name", namespace="$namespace"}[2m]))) avg: sum(increase(milvus_indexnode_decode_field_latency_sum{app_kubernetes_io_instance=~"$instance", app_kubernetes_io_name="$app_name", namespace="$namespace"}[2m])) by(pod, node_id) / sum(increase(milvus_indexnode_decode_field_latency_count{app_kubernetes_io_instance=~"$instance", app_kubernetes_io_name="$app_name", namespace="$namespace"}[2m])) by(pod, node_id) | milvus_indexnode_decode_field_latency | Waktu yang digunakan untuk memecahkan kode data lapangan. |
Membangun Latensi Indeks | Latensi rata-rata dan persentil ke-99 dari waktu yang digunakan oleh setiap simpul indeks untuk membangun indeks dalam dua menit terakhir. | p99: histogram_quantile(0.99, sum by (le, pod, node_id) (rate(milvus_indexnode_build_index_latency_bucket{app_kubernetes_io_instance=~"$instance", app_kubernetes_io_name="$app_name", namespace="$namespace"}[2m]))) avg: sum(increase(milvus_indexnode_build_index_latency_sum{app_kubernetes_io_instance=~"$instance", app_kubernetes_io_name="$app_name", namespace="$namespace"}[2m])) by(pod, node_id) / sum(increase(milvus_indexnode_build_index_latency_count{app_kubernetes_io_instance=~"$instance", app_kubernetes_io_name="$app_name", namespace="$namespace"}[2m])) by(pod, node_id) | milvus_indexnode_build_index_latency | Waktu yang digunakan untuk membangun indeks. |
Menyandikan Latensi Indeks | Latensi rata-rata dan persentil ke-99 dari waktu yang digunakan oleh setiap simpul indeks untuk menyandikan file indeks dalam dua menit terakhir. | p99: histogram_quantile(0.99, sum by (le, pod, node_id) (rate(milvus_indexnode_encode_index_latency_bucket{app_kubernetes_io_instance=~"$instance", app_kubernetes_io_name="$app_name", namespace="$namespace"}[2m]))) avg: sum(increase(milvus_indexnode_encode_index_latency_sum{app_kubernetes_io_instance=~"$instance", app_kubernetes_io_name="$app_name", namespace="$namespace"}[2m])) by(pod, node_id) / sum(increase(milvus_indexnode_encode_index_latency_count{app_kubernetes_io_instance=~"$instance", app_kubernetes_io_name="$app_name", namespace="$namespace"}[2m])) by(pod, node_id) | milvus_indexnode_encode_index_latency | Waktu yang digunakan untuk menyandikan file indeks. |
Simpan Latensi Indeks | Latensi rata-rata dan persentil ke-99 dari waktu yang digunakan oleh setiap simpul indeks untuk menyimpan berkas indeks dalam dua menit terakhir. | p99: histogram_quantile(0.99, sum by (le, pod, node_id) (rate(milvus_indexnode_save_index_latency_bucket{app_kubernetes_io_instance=~"$instance", app_kubernetes_io_name="$app_name", namespace="$namespace"}[2m]))) avg: sum(increase(milvus_indexnode_save_index_latency_sum{app_kubernetes_io_instance=~"$instance", app_kubernetes_io_name="$app_name", namespace="$namespace"}[2m])) by(pod, node_id) / sum(increase(milvus_indexnode_save_index_latency_count{app_kubernetes_io_instance=~"$instance", app_kubernetes_io_name="$app_name", namespace="$namespace"}[2m])) by(pod, node_id) | milvus_indexnode_save_index_latency | Waktu yang digunakan untuk menyimpan file indeks. |