لوحة معلومات مقاييس ميلفوس
يُخرج Milvus قائمة بمقاييس مفصلة متسلسلة زمنيًا أثناء وقت التشغيل. يمكنك استخدام Prometheus و Grafana لتصور المقاييس. يقدم هذا الموضوع مقاييس المراقبة المعروضة في لوحة عدادات Grafana Milvus Dashboard.
وحدة الوقت في هذا الموضوع هي المللي ثانية. وتشير "النسبة المئوية 99 في المائة" في هذا الموضوع إلى حقيقة أن 99 في المائة من إحصائيات الوقت يتم التحكم فيها ضمن قيمة معينة.
نوصي بقراءة نظرة عامة على إطار عمل مراقبة Milvus لفهم مقاييس Prometheus أولاً.
الوكيل
لوحة | وصف اللوحة | PromQL (لغة استعلام Prometheus) | مقاييس ميلفوس المستخدمة | وصف مقاييس ميلفوس |
---|---|---|---|---|
معدل عدد ناقلات البحث | متوسط عدد المتجهات التي تم الاستعلام عنها في الثانية من قبل كل وكيل خلال الدقيقتين الماضيتين. | sum(increase(milvus_proxy_search_vectors_count{app_kubernetes_io_instance=~"$instance", app_kubernetes_io_name="$app_name", namespace="$namespace"}[2m])/120) by (pod, node_id) | milvus_proxy_search_vectors_count | العدد المتراكم للمتجهات التي تم الاستعلام عنها. |
معدل عدد ناقلات الإدراج | متوسط عدد النواقل التي تم إدراجها في الثانية الواحدة بواسطة كل وكيل خلال الدقيقتين الماضيتين. | sum(increase(milvus_proxy_insert_vectors_count{app_kubernetes_io_instance=~"$instance", app_kubernetes_io_name="$app_name", namespace="$namespace"}[2m])/120) by (pod, node_id) | milvus_proxy_insert_vectors_count | العدد المتراكم للناقلات التي تم إدراجها. |
زمن انتقال البحث | متوسط زمن الاستجابة والنسبة المئوية الـ 99 من زمن الاستجابة لتلقي طلبات البحث والاستعلام من قبل كل وكيل خلال الدقيقتين الماضيتين. | p99: histogram_quantile(0.99, sum by (le, query_type, pod, node_id) (rate(milvus_proxy_sq_latency_bucket{app_kubernetes_io_instance=~"$instance", app_kubernetes_io_name="$app_name", namespace="$namespace"}[2m]))) avg: sum(increase(milvus_proxy_sq_latency_sum{app_kubernetes_io_instance=~"$instance", app_kubernetes_io_name="$app_name", namespace="$namespace"}[2m])) by (pod, node_id, query_type) / sum(increase(milvus_proxy_sq_latency_count{app_kubernetes_io_instance=~"$instance", app_kubernetes_io_name="$app_name", namespace="$namespace"}[2m])) by (pod, node_id, query_type) | milvus_proxy_sq_latency | زمن انتقال طلبات البحث والاستعلام. |
زمن انتقال بحث المجموعة | متوسط زمن الاستجابة والنسبة المئوية الـ 99 لزمن الاستجابة لتلقي طلبات البحث والاستعلام إلى مجموعة محددة بواسطة كل وكيل خلال الدقيقتين الماضيتين. | p99: histogram_quantile(0.99, sum by (le, query_type, pod, node_id) (rate(milvus_proxy_collection_sq_latency_bucket{app_kubernetes_io_instance=~"$instance", app_kubernetes_io_name="$app_name", namespace="$namespace", collection_name=~"$collection"}[2m]))) avg: sum(increase(milvus_proxy_collection_sq_latency_sum{app_kubernetes_io_instance=~"$instance", app_kubernetes_io_name="$app_name", namespace="$namespace", collection_name=~"$collection"}[2m])) by (pod, node_id, query_type) / sum(increase(milvus_proxy_collection_sq_latency_count{app_kubernetes_io_instance=~"$instance", app_kubernetes_io_name="$app_name", namespace="$namespace", collection_name=~"$collection"}[2m])) by (pod, node_id, query_type) | milvus_proxy_collection_sq_latency_sum | زمن الوصول لطلبات البحث والاستعلام إلى مجموعة محددة من قبل كل وكيل |
زمن الانتقال | متوسط زمن الكمون والنسبة المئوية الـ 99 لزمن الاستجابة لطلبات الطفرات من قبل كل وكيل خلال الدقيقتين الماضيتين. | p99: histogram_quantile(0.99, sum by (le, msg_type, pod, node_id) (rate(milvus_proxy_mutation_latency_bucket{app_kubernetes_io_instance=~"$instance", app_kubernetes_io_name="$app_name", namespace="$namespace"}[2m]))) avg: sum(increase(milvus_proxy_mutation_latency_sum{app_kubernetes_io_instance=~"$instance", app_kubernetes_io_name="$app_name", namespace="$namespace"}[2m])) by (pod, node_id, msg_type) / sum(increase(milvus_proxy_mutation_latency_count{app_kubernetes_io_instance=~"$instance", app_kubernetes_io_name="$app_name", namespace="$namespace"}[2m])) by (pod, node_id, msg_type) | milvus_proxy_mutation_latency_sum | زمن انتقال طلبات الطفرات. |
زمن انتقال مجموعة الطفرات | متوسط زمن الاستجابة والنسبة المئوية الـ 99 لزمن الاستجابة لتلقي طلبات الطفرات إلى مجموعة محددة من قبل كل وكيل خلال الدقيقتين الماضيتين. | p99: histogram_quantile(0.99, sum by (le, query_type, pod, node_id) (rate(milvus_proxy_collection_sq_latency_bucket{app_kubernetes_io_instance=~"$instance", app_kubernetes_io_name="$app_name", namespace="$namespace", collection_name=~"$collection"}[2m]))) متوسط: sum(increase(milvus_proxy_collection_sq_latency_sum{app_kubernetes_io_instance=~"$instance", app_kubernetes_io_name="$app_name", namespace="$namespace", collection_name=~"$collection"}[2m])) by (pod, node_id, query_type) / sum(increase(milvus_proxy_collection_sq_latency_count{app_kubernetes_io_instance=~"$instance", app_kubernetes_io_name="$app_name", namespace="$namespace", collection_name=~"$collection"}[2m])) by (pod, node_id, query_type) | milvus_proxy_collection_sq_latency_sum | زمن انتقال طلبات الطفرات إلى مجموعة محددة |
زمن انتظار نتائج البحث | متوسط زمن الاستجابة والنسبة المئوية الـ 99 لزمن الاستجابة بين إرسال طلبات البحث والاستعلام وتلقي النتائج بواسطة الوكيل خلال الدقيقتين الماضيتين. | p99: histogram_quantile(0.99, sum by (le, query_type, pod, node_id) (rate(milvus_proxy_sq_wait_result_latency_bucket{app_kubernetes_io_instance=~"$instance", app_kubernetes_io_name="$app_name", namespace="$namespace"}[2m]))) avg: sum(increase(milvus_proxy_sq_wait_result_latency_sum{app_kubernetes_io_instance=~"$instance", app_kubernetes_io_name="$app_name", namespace="$namespace"}[2m])) by (pod, node_id, query_type) / sum(increase(milvus_proxy_sq_wait_result_latency_count{app_kubernetes_io_instance=~"$instance", app_kubernetes_io_name="$app_name", namespace="$namespace"}[2m])) by (pod, node_id, query_type) | milvus_proxy_sq_wait_result_latency | زمن الاستجابة بين إرسال طلبات البحث والاستعلام واستلام النتائج. |
تقليل زمن انتقال نتائج البحث | متوسط زمن الاستجابة والنسبة المئوية الـ 99 لزمن الاستجابة لتجميع نتائج البحث والاستعلام عن طريق الوكيل خلال الدقيقتين الماضيتين. | p99: histogram_quantile(0.99, sum by (le, query_type, pod, node_id) (rate(milvus_proxy_sq_reduce_result_latency_bucket{app_kubernetes_io_instance=~"$instance", app_kubernetes_io_name="$app_name", namespace="$namespace"}[2m]))) متوسط: sum(increase(milvus_proxy_sq_reduce_result_latency_sum{app_kubernetes_io_instance=~"$instance", app_kubernetes_io_name="$app_name", namespace="$namespace"}[2m])) by (pod, node_id, query_type) / sum(increase(milvus_proxy_sq_reduce_result_latency_count{app_kubernetes_io_instance=~"$instance", app_kubernetes_io_name="$app_name", namespace="$namespace"}[2m])) by (pod, node_id, query_type) | milvus_proxy_sq_reduce_result_latency | زمن انتقال تجميع نتائج البحث والاستعلام التي تم إرجاعها بواسطة كل عقدة استعلام. |
زمن انتقال نتائج البحث عن طريق فك التشفير | متوسط زمن الاستجابة والنسبة المئوية الـ 99 لزمن الاستجابة لفك تشفير نتائج البحث والاستعلام حسب الوكيل خلال الدقيقتين الماضيتين. | p99: histogram_quantile(0.99, sum by (le, query_type, pod, node_id) (rate(milvus_proxy_sq_decode_result_latency_bucket{app_kubernetes_io_instance=~"$instance", app_kubernetes_io_name="$app_name", namespace="$namespace"}[2m]))) متوسط: sum(increase(milvus_proxy_sq_decode_result_latency_sum{app_kubernetes_io_instance=~"$instance", app_kubernetes_io_name="$app_name", namespace="$namespace"}[2m])) by (pod, node_id, query_type) / sum(increase(milvus_proxy_sq_decode_resultlatency_count{app_kubernetes_io_instance=~"$instance", app_kubernetes_io_name="$app_name", namespace="$namespace"}[2m])) by (pod, node_id, query_type) | milvus_proxy_sq_decode_result_latency | زمن الانتقال لفك تشفير كل نتيجة بحث واستعلام. |
عدد كائنات دفق الرسائل | متوسط عدد كائنات دفق الرسائل والحد الأقصى والأدنى لعدد كائنات دفق الرسائل التي تم إنشاؤها بواسطة كل وكيل على الموضوع الفعلي المقابل له خلال الدقيقتين الماضيتين. | avg(milvus_proxy_msgstream_obj_num{app_kubernetes_io_instance=~"$instance", app_kubernetes_io_name="$app_name", namespace="$namespace"}) by (pod, node_id) max(milvus_proxy_msgstream_obj_num{app_kubernetes_io_instance=~"$instance", app_kubernetes_io_name="$app_name", namespace="$namespace"}) by (pod, node_id) min(milvus_proxy_msgstream_obj_num{app_kubernetes_io_instance=~"$instance", app_kubernetes_io_name="$app_name", namespace="$namespace"}) by (pod, node_id) | milvus_proxy_msgstream_obj_num | عدد كائنات دفق الرسائل التي تم إنشاؤها على كل موضوع فعلي. |
زمن انتقال إرسال الطفرات | متوسط زمن الكمون والنسبة المئوية الـ 99 لزمن انتقال إرسال طلبات الإدراج أو الحذف من قبل كل وكيل خلال الدقيقتين الماضيتين. | p99: histogram_quantile(0.99, sum by (le, msg_type, pod, node_id) (rate(milvus_proxy_mutation_send_latency_bucket{app_kubernetes_io_instance=~"$instance", app_kubernetes_io_name="$app_name", namespace="$namespace"}[2m]))) متوسط: sum(increase(milvus_proxy_mutation_send_latency_sum{app_kubernetes_io_instance=~"$instance", app_kubernetes_io_name="$app_name", namespace="$namespace"}[2m])) by (pod, node_id, msg_type) / sum(increase(milvus_proxy_mutation_send_latency_count{app_kubernetes_io_instance=~"$instance", app_kubernetes_io_name="$app_name", namespace="$namespace"}[2m])) by (pod, node_id, msg_type) | milvus_proxy_mutation_send_latency | زمن الاستجابة لإرسال طلبات الإدراج أو الحذف. |
معدل إصابة ذاكرة التخزين المؤقت | متوسط معدل إصابة ذاكرة التخزين المؤقت للعمليات بما في ذلك GeCollectionID و GetCollectionInfo و GetCollectionSchema في الثانية خلال الدقيقتين الماضيتين. | sum(increase(milvus_proxy_cache_hit_count{app_kubernetes_io_instance=~"$instance", app_kubernetes_io_name="$app_name", namespace="$namespace", cache_state="hit"}[2m])/120) by(cache_name, pod, node_id) / sum(increase(milvus_proxy_cache_hit_count{app_kubernetes_io_instance=~"$instance", app_kubernetes_io_name="$app_name", namespace="$namespace"}[2m])/120) by(cache_name, pod, node_id) | milvus_proxy_cache_hit_count | إحصائيات معدل الإصابة والفشل لكل عملية قراءة في ذاكرة التخزين المؤقت. |
زمن انتقال تحديث ذاكرة التخزين المؤقت | متوسط زمن الاستجابة والنسبة المئوية الـ 99 من زمن استجابة تحديث ذاكرة التخزين المؤقت حسب الوكيل خلال الدقيقتين الماضيتين. | p99: histogram_quantile(0.99, sum by (le, pod, node_id) (rate(milvus_proxy_cache_update_latency_bucket{app_kubernetes_io_instance=~"$instance", app_kubernetes_io_name="$app_name", namespace="$namespace"}[2m]))) متوسط: sum(increase(milvus_proxy_cache_update_latency_sum{app_kubernetes_io_instance=~"$instance", app_kubernetes_io_name="$app_name", namespace="$namespace"}[2m])) by (pod, node_id) / sum(increase(milvus_proxy_cache_update_latency_count{app_kubernetes_io_instance=~"$instance", app_kubernetes_io_name="$app_name", namespace="$namespace"}[2m])) by (pod, node_id) | milvus_proxy_cache_update_latency | زمن انتقال تحديث ذاكرة التخزين المؤقت في كل مرة. |
وقت المزامنة | متوسط عدد مرات المزامنة والحد الأقصى والأدنى لوقت الحقبة الزمنية التي تمت مزامنتها بواسطة كل وكيل في القناة الفعلية المقابلة له. | avg(milvus_proxy_sync_epoch_time{app_kubernetes_io_instance=~"$instance", app_kubernetes_io_name="$app_name", namespace="$namespace"}) by (pod, node_id) max(milvus_proxy_sync_epoch_time{app_kubernetes_io_instance=~"$instance", app_kubernetes_io_name="$app_name", namespace="$namespace"}) by (pod, node_id) min(milvus_proxy_sync_epoch_time{app_kubernetes_io_instance=~"$instance", app_kubernetes_io_name="$app_name", namespace="$namespace"}) by (pod, node_id) | milvus_proxy_sync_epoch_time | وقت الحقبة الزمنية لكل قناة فعلية (توقيت يونيكس، أي الميلي ثانية التي مرت منذ 1 يناير 1970). يوجد ChannelName افتراضي بصرف النظر عن القنوات الفعلية. |
تطبيق كمون PK الكمون | متوسط زمن الكمون والنسبة المئوية الـ 99 من زمن انتقال تطبيق المفتاح الأساسي لكل وكيل خلال الدقيقتين الماضيتين. | p99: histogram_quantile(0.99, sum by (le, pod, node_id) (rate(milvus_proxy_apply_pk_latency_bucket{app_kubernetes_io_instance=~"$instance", app_kubernetes_io_name="$app_name", namespace="$namespace"}[2m]))) avg: sum(increase(milvus_proxy_apply_pk_latency_sum{app_kubernetes_io_instance=~"$instance", app_kubernetes_io_name="$app_name", namespace="$namespace"}[2m])) by (pod, node_id) / sum(increase(milvus_proxy_apply_pk_latency_count{app_kubernetes_io_instance=~"$instance", app_kubernetes_io_name="$app_name", namespace="$namespace"}[2m])) by (pod, node_id) | milvus_proxy_apply_pk_latency | زمن انتقال تطبيق المفتاح الأساسي. |
زمن انتقال تطبيق الطابع الزمني | متوسط زمن الانتقال والنسبة المئوية 99 لزمن انتقال تطبيق الطابع الزمني بواسطة كل وكيل خلال الدقيقتين الماضيتين. | p99: histogram_quantile(0.99, sum by (le, pod, node_id) (rate(milvus_proxy_apply_timestamp_latency_bucket{app_kubernetes_io_instance=~"$instance", app_kubernetes_io_name="$app_name", namespace="$namespace"}[2m]))) متوسط: sum(increase(milvus_proxy_apply_timestamp_latency_sum{app_kubernetes_io_instance=~"$instance", app_kubernetes_io_name="$app_name", namespace="$namespace"}[2m])) by (pod, node_id) / sum(increase(milvus_proxy_apply_timestamp_latency_count{app_kubernetes_io_instance=~"$instance", app_kubernetes_io_name="$app_name", namespace="$namespace"}[2m])) by (pod, node_id) | milvus_proxy_apply_timestamp_latency | زمن انتقال تطبيق الطابع الزمني. |
معدل نجاح الطلبات | عدد الطلبات الناجحة التي يتلقاها كل وكيل في الثانية، مع تفصيل مفصل لكل نوع طلب. أنواع الطلبات المحتملة هي DescribeCollection، وDescribeIndex، وDiscribeIndex، وGetCollectionStatistics، وHasCollection، وHasCollection، وSearch، وSquery، وEhowPartitions، وIntrert، وما إلى ذلك. | |||
sum(increase(milvus_proxy_req_count{app_kubernetes_io_instance=~"$instance", app_kubernetes_io_name="$app_name", namespace="$namespace", status="success"}[2m])/120) by(function_name, pod, node_id) | milvus_proxy_req_count | عدد جميع أنواع الطلبات المستلمة | ||
معدل الطلبات الفاشلة | عدد الطلبات الفاشلة التي يتلقاها كل وكيل في الثانية، مع تفصيل مفصل لكل نوع طلب. أنواع الطلبات المحتملة هي DescribeCollection، وDescribeIndex، وDiscribeIndex، وGetCollectionStatistics، وHasCollection، وSearch، وSquery، وEhowPartitions، وIntert، وما إلى ذلك. | |||
sum(increase(milvus_proxy_req_count{app_kubernetes_io_instance=~"$instance", app_kubernetes_io_name="$app_name", namespace="$namespace", status="fail"}[2m])/120) by(function_name, pod, node_id) | milvus_proxy_req_count | عدد جميع أنواع الطلبات المستلمة | ||
زمن انتقال الطلب | متوسط زمن الاستجابة والنسبة المئوية الـ 99 من زمن الاستجابة لجميع أنواع طلبات الاستقبال من قبل كل وكيل | p99: histogram_quantile(0.99, sum by (le, pod, node_id, function_name) (rate(milvus_proxy_req_latency_bucket{app_kubernetes_io_instance=~"$instance", app_kubernetes_io_name="$app_name", namespace="$namespace"}[2m]))) متوسط: sum(increase(milvus_proxy_req_latency_sum{app_kubernetes_io_instance=~"$instance", app_kubernetes_io_name="$app_name", namespace="$namespace"}[2m])) by (pod, node_id, function_name) / sum(increase(milvus_proxy_req_latency_count{app_kubernetes_io_instance=~"$instance", app_kubernetes_io_name="$app_name", namespace="$namespace"}[2m])) by (pod, node_id, function_name) | milvus_proxy_req_latency | زمن الاستجابة لجميع أنواع طلبات الاستقبال |
معدل بايتات طلبات الإدراج/الحذف | عدد البايتات من طلبات الإدراج والحذف المستلمة في الثانية الواحدة بواسطة الوكيل خلال الدقيقتين الماضيتين. | sum(increase(milvus_proxy_receive_bytes_count{app_kubernetes_io_instance=~"$instance", app_kubernetes_io_name="$app_name", namespace="$namespace"}[2m])/120) by(pod, node_id) | milvus_proxy_receive_bytes_count | عدد طلبات الإدراج والحذف. |
معدل البايت المرسلة | عدد وحدات البايت في الثانية المرسلة إلى العميل أثناء استجابة كل وكيل لطلبات البحث والاستعلام خلال الدقيقتين الماضيتين. | sum(increase(milvus_proxy_send_bytes_count{app_kubernetes_io_instance=~"$instance", app_kubernetes_io_name="$app_name", namespace="$namespace"}[2m])/120) by(pod, node_id) | milvus_proxy_send_bytes_count | عدد وحدات البايت المرسلة مرة أخرى إلى العميل أثناء استجابة كل وكيل لطلبات البحث والاستعلام. |
المنسق الجذر
لوحة | وصف اللوحة | PromQL (لغة استعلام Prometheus) | مقاييس ميلفوس المستخدمة | وصف مقاييس ميلفوس |
---|---|---|---|---|
عدد عقدة الوكيل | عدد الوكلاء الذين تم إنشاؤهم. | sum(milvus_rootcoord_proxy_num{app_kubernetes_io_instance=~"$instance", app_kubernetes_io_name="$app_name", namespace="$namespace"}) by (app_kubernetes_io_instance) | milvus_rootcoord_proxy_num | عدد الوكلاء. |
وقت المزامنة | متوسط، والحد الأقصى، والحد الأدنى لوقت الحقبة الزمنية التي تمت مزامنتها من قبل كل منسق جذر في كل قناة فعلية (قناة PC). | avg(milvus_rootcoord_sync_epoch_time{app_kubernetes_io_instance=~"$instance", app_kubernetes_io_name="$app_name", namespace="$namespace"}) by (app_kubernetes_io_instance) max(milvus_rootcoord_sync_epoch_time{app_kubernetes_io_instance=~"$instance", app_kubernetes_io_name="$app_name", namespace="$namespace"}) by (app_kubernetes_io_instance) min(milvus_rootcoord_sync_epoch_time{app_kubernetes_io_instance=~"$instance", app_kubernetes_io_name="$app_name", namespace="$namespace"}) by (app_kubernetes_io_instance) | milvus_rootcoord_sync_epoch_time | زمن الحقبة الزمنية لكل قناة فعلية (توقيت يونيكس، الميلي ثانية التي مرت منذ 1 يناير 1970). |
معدل طلبات DDL | حالة وعدد طلبات DDL في الثانية خلال الدقيقتين الماضيتين. | sum(increase(milvus_rootcoord_ddl_req_count{app_kubernetes_io_instance=~"$instance", app_kubernetes_io_name="$app_name", namespace="$namespace"}[2m])/120) by (status, function_name) | milvus_rootcoord_ddl_req_count | العدد الإجمالي لطلبات DDL بما في ذلك CreateCollection و DescribeCollection و و DescribeSegments و HasCollection و ShowCollections و ShowPartitions و ShowSegments . |
كمون طلب DDL | متوسط زمن الاستجابة والنسبة المئوية الـ 99 من زمن استجابة طلبات DDL خلال الدقيقتين الماضيتين. | p99: histogram_quantile(0.99, sum by (le, function_name) (rate(milvus_rootcoord_ddl_req_latency_bucket{app_kubernetes_io_instance=~"$instance", app_kubernetes_io_name="$app_name", namespace="$namespace"}[2m]))) avg: sum(increase(milvus_rootcoord_ddl_req_latency_sum{app_kubernetes_io_instance=~"$instance", app_kubernetes_io_name="$app_name", namespace="$namespace"}[2m])) by (function_name) / sum(increase(milvus_rootcoord_ddl_req_latency_count{app_kubernetes_io_instance=~"$instance", app_kubernetes_io_name="$app_name", namespace="$namespace"}[2m])) by (function_name) | milvus_rootcoord_ddl_req_latency | زمن انتقال جميع أنواع طلبات DDL. |
زمن الانتقال الزمني للمزامنة | متوسط زمن الاستجابة والنسبة المئوية الـ 99 للوقت الذي استخدمه جذر التنسيق لمزامنة جميع الطوابع الزمنية مع قناة PChannel خلال الدقيقتين الماضيتين. | p99: histogram_quantile(0.99, sum by (le) (rate(milvus_rootcoord_sync_timetick_latency_bucket{app_kubernetes_io_instance=~"$instance", app_kubernetes_io_name="$app_name", namespace="$namespace"}[2m]))) متوسط: sum(increase(milvus_rootcoord_sync_timetick_latency_sum{app_kubernetes_io_instance=~"$instance", app_kubernetes_io_name="$app_name", namespace="$namespace"}[2m])) / sum(increase(milvus_rootcoord_sync_timetick_latency_count{app_kubernetes_io_instance=~"$instance", app_kubernetes_io_name="$app_name", namespace="$namespace"}[2m])) | milvus_rootcoord_sync_timetick_latency | الوقت الذي استخدمه جذر التنسيق لمزامنة جميع الطوابع الزمنية إلى قناة pchannel. |
معدل تخصيص المعرفات | عدد المعرفات المعينة بواسطة جذر التنسيق في الثانية خلال الدقيقتين الماضيتين. | sum(increase(milvus_rootcoord_id_alloc_count{app_kubernetes_io_instance=~"$instance", app_kubernetes_io_name="$app_name", namespace="$namespace"}[2m])/120) | milvus_rootcoord_id_alloc_count | العدد المتراكم للمعرفات المعينة بواسطة جذر التنسيق. |
الطابع الزمني | الطابع الزمني الأخير لنسق الجذر. | milvus_rootcoord_timestamp{app_kubernetes_io_instance=~"$instance", app_kubernetes_io_name="$app_name", namespace="$namespace"} | milvus_rootcoord_timestamp | الطابع الزمني الأخير لنسق الجذر. |
الطابع الزمني المحفوظ | الطوابع الزمنية المعينة مسبقاً التي يحفظها جذر التنسيق في مخزن التعريف. | milvus_rootcoord_timestamp_saved{app_kubernetes_io_instance=~"$instance", app_kubernetes_io_name="$app_name", namespace="$namespace"} | milvus_rootcoord_timestamp_saved | الطوابع الزمنية المعينة مسبقاً التي يحفظها جذر التنسيق في مخزن التعريف. يتم تعيين الطوابع الزمنية المعينة مسبقاً قبل 3 ثوانٍ. ويتم تحديث الطابع الزمني وحفظه في مخزن التعريف كل 50 مللي ثانية. |
عدد المجموعات | العدد الإجمالي للمجموعات. | sum(milvus_rootcoord_collection_num{app_kubernetes_io_instance=~"$instance", app_kubernetes_io_name="$app_name", namespace="$namespace"}) by (app_kubernetes_io_instance) | milvus_rootcoord_collection_num | إجمالي عدد المجموعات الموجودة في Milvus حالياً. |
عدد الأقسام | العدد الإجمالي للأقسام. | sum(milvus_rootcoord_partition_num{app_kubernetes_io_instance=~"$instance", app_kubernetes_io_name="$app_name", namespace="$namespace"}) by (app_kubernetes_io_instance) | milvus_rootcoord_partition_num | إجمالي عدد الأقسام الموجودة في Milvus حالياً. |
عدد قنوات DML | إجمالي عدد قنوات DML. | sum(milvus_rootcoord_dml_channel_num{app_kubernetes_io_instance=~"$instance", app_kubernetes_io_name="$app_name", namespace="$namespace"}) by (app_kubernetes_io_instance) | milvus_rootcoord_dml_channel_num | إجمالي عدد قنوات DML الموجودة في Milvus حالياً. |
عدد قنوات msgstream | إجمالي عدد قنوات msgstreams. | sum(milvus_rootcoord_msgstream_obj_num{app_kubernetes_io_instance=~"$instance", app_kubernetes_io_name="$app_name", namespace="$namespace"}) by (app_kubernetes_io_instance) | milvus_rootcoord_msgstream_obj_num | إجمالي عدد تدفقات الرسائل الموجودة في Milvus حالياً. |
عدد بيانات الاعتماد | إجمالي عدد بيانات الاعتماد. | sum(milvus_rootcoord_credential_num{app_kubernetes_io_instance=~"$instance", app_kubernetes_io_name="$app_name", namespace="$namespace"}) by (app_kubernetes_io_instance) | milvus_rootcoord_credential_num | إجمالي عدد بيانات الاعتماد في Milvus حالياً. |
تأخير تيك الوقت | مجموع الحد الأقصى لتأخير التجزئة الزمنية القصوى للرسوم البيانية للتدفق على جميع عقد البيانات وعقد الاستعلام. | sum(milvus_rootcoord_time_tick_delay{app_kubernetes_io_instance=~"$instance", app_kubernetes_io_name="$app_name", namespace="$namespace"}) by (app_kubernetes_io_instance) | milvus_rootcoord_time_tick_delay | الحد الأقصى لتأخير التجزئة الزمنية القصوى للرسوم البيانية للتدفق على كل DataNode وCueryNode. |
منسق الاستعلام
لوحة | وصف اللوحة | PromQL (لغة استعلام Prometheus) | مقاييس ميلفوس المستخدمة | وصف مقاييس ميلفوس |
---|---|---|---|---|
عدد المجموعات التي تم تحميلها | عدد المجموعات التي يتم تحميلها حالياً في الذاكرة. | sum(milvus_querycoord_collection_num{app_kubernetes_io_instance=~"$instance", app_kubernetes_io_name="$app_name", namespace="$namespace"}) by (app_kubernetes_io_instance) | milvus_querycoord_collection_num | عدد المجموعات التي يتم تحميلها حالياً بواسطة Milvus. |
عدد الكيانات التي تم تحميلها حالياً | عدد الكيانات التي يتم تحميلها حالياً في الذاكرة. | sum(milvus_querycoord_entity_num{app_kubernetes_io_instance=~"$instance", app_kubernetes_io_name="$app_name", namespace="$namespace"}) by (app_kubernetes_io_instance) | milvus_querycoord_entitiy_num | عدد الكيانات التي يتم تحميلها حالياً بواسطة Milvus. |
معدل طلبات التحميل | عدد طلبات التحميل في الثانية خلال الدقيقتين الماضيتين. | sum(increase(milvus_querycoord_load_req_count{app_kubernetes_io_instance=~"$instance", app_kubernetes_io_name="$app_name", namespace="$namespace"}[2m])120) by (status) | milvus_querycoord_load_req_count | العدد المتراكم لطلبات التحميل. |
معدل طلبات الإصدار | عدد طلبات الإصدار لكل ثانية خلال الدقيقتين الماضيتين. | sum(increase(milvus_querycoord_release_req_count{app_kubernetes_io_instance=~"$instance", app_kubernetes_io_name="$app_name", namespace="$namespace"}[2m])/120) by (status) | milvus_querycoord_release_req_count | عدد طلبات الإصدار المتراكمة. |
زمن انتقال طلب التحميل | متوسط زمن الاستجابة والنسبة المئوية 99 من زمن استجابة طلبات التحميل خلال الدقيقتين الماضيتين. | p99: histogram_quantile(0.99, sum by (le) (rate(milvus_querycoord_load_latency_bucket{app_kubernetes_io_instance=~"$instance", app_kubernetes_io_name="$app_name", namespace="$namespace"}[2m]))) avg: sum(increase(milvus_querycoord_load_latency_sum{app_kubernetes_io_instance=~"$instance", app_kubernetes_io_name="$app_name", namespace="$namespace"}[2m])) / sum(increase(milvus_querycoord_load_latency_count{app_kubernetes_io_instance=~"$instance", app_kubernetes_io_name="$app_name", namespace="$namespace"}[2m])) | milvus_querycoord_load_latency | الوقت المستخدم لإكمال طلب التحميل. |
زمن انتقال طلب الإصدار | متوسط زمن الاستجابة والنسبة المئوية الـ 99 من زمن استجابة طلب الإصدار خلال الدقيقتين الماضيتين. | p99: histogram_quantile(0.99, sum by (le) (rate(milvus_querycoord_release_latency_bucket{app_kubernetes_io_instance=~"$instance", app_kubernetes_io_name="$app_name", namespace="$namespace"}[2m]))) avg: sum(increase(milvus_querycoord_release_latency_sum{app_kubernetes_io_instance=~"$instance", app_kubernetes_io_name="$app_name", namespace="$namespace"}[2m])) / sum(increase(milvus_querycoord_release_latency_count{app_kubernetes_io_instance=~"$instance", app_kubernetes_io_name="$app_name", namespace="$namespace"}[2m])) | milvus_querycoord_release_latency | الوقت المستخدم لإكمال طلب الإصدار. |
مهمة التحميل الفرعي | عدد مهام التحميل الفرعي. | sum(milvus_querycoord_child_task_num{app_kubernetes_io_instance=~"$instance", app_kubernetes_io_name="$app_name", namespace="$namespace"}) by (app_kubernetes_io_instance) | milvus_querycoord_child_task_num | عدد مهام التحميل الفرعية. يقسم تنسيق الاستعلام طلب التحميل إلى مهام تحميل فرعية متعددة. |
مهمة التحميل الأصلية | عدد مهام التحميل الأصلية. | sum(milvus_querycoord_parent_task_num{app_kubernetes_io_instance=~"$instance", app_kubernetes_io_name="$app_name", namespace="$namespace"}) by (app_kubernetes_io_instance) | milvus_querycoord_parent_task_num | عدد مهام التحميل الفرعية. يتوافق كل طلب تحميل مع مهمة أصل في قائمة انتظار المهام. |
زمن انتقال مهام التحميل الفرعية | متوسط زمن الانتقال والنسبة المئوية 99 من زمن انتقال مهمة تحميل فرعية خلال الدقيقتين الماضيتين. | p99: histogram_quantile(0.99, sum by (le) (rate(milvus_querycoord_child_task_latency_bucket{app_kubernetes_io_instance=~"$instance", app_kubernetes_io_name="$app_name", namespace="$namespace"}[2m]))) avg: sum(increase(milvus_querycoord_child_task_latency_sum{app_kubernetes_io_instance=~"$instance", app_kubernetes_io_name="$app_name", namespace="$namespace"}[2m])) / sum(increase(milvus_querycoord_child_task_latency_count{app_kubernetes_io_instance=~"$instance", app_kubernetes_io_name="$app_name", namespace="$namespace"}[2m])) namespace"}[2m]))) | milvus_querycoord_child_task_latency | زمن الاستجابة لإكمال مهمة تحميل فرعي. |
عدد عُقد الاستعلام | عدد عقد الاستعلام التي يديرها منسق الاستعلام. | sum(milvus_querycoord_querynode_num{app_kubernetes_io_instance=~"$instance", app_kubernetes_io_name="$app_name", namespace="$namespace"}) by (app_kubernetes_io_instance) | milvus_querycoord_querynode_num | عدد عقد الاستعلام التي يديرها منسق الاستعلام. |
عقدة الاستعلام
لوحة | وصف اللوحة | PromQL (لغة استعلام Prometheus) | مقاييس ميلفوس المستخدمة | وصف مقاييس ميلفوس |
---|---|---|---|---|
عدد المجموعات التي تم تحميلها | عدد المجموعات التي تم تحميلها في الذاكرة بواسطة كل عقدة استعلام. | sum(milvus_querynode_collection_num{app_kubernetes_io_instance=~"$instance", app_kubernetes_io_name="$app_name", namespace="$namespace"}) by (pod, node_id) | milvus_querynode_collection_num | عدد المجموعات التي تم تحميلها بواسطة كل عقدة استعلام. |
عدد الأقسام المحملة في الذاكرة | عدد الأقسام التي تم تحميلها في الذاكرة بواسطة كل عقدة استعلام. | sum(milvus_querynode_partition_num{app_kubernetes_io_instance=~"$instance", app_kubernetes_io_name="$app_name", namespace="$namespace"}) by (pod, node_id) | milvus_querynode_partition_num | عدد الأقسام التي تم تحميلها بواسطة كل عقدة استعلام. |
عدد الأجزاء المحملة في الذاكرة | عدد المقاطع التي تم تحميلها في الذاكرة بواسطة كل عقدة استعلام. | sum(milvus_querynode_segment_num{app_kubernetes_io_instance=~"$instance", app_kubernetes_io_name="$app_name", namespace="$namespace"}) by (pod, node_id) | milvus_querynode_segment_num | عدد المقاطع التي تم تحميلها بواسطة كل عقدة استعلام. |
عدد الكيانات القابلة للاستعلام والبحث | عدد الكيانات القابلة للاستعلام والبحث عنها في كل عقدة استعلام. | sum(milvus_querynode_entity_num{app_kubernetes_io_instance=~"$instance", app_kubernetes_io_name="$app_name", namespace="$namespace"}) by (pod, node_id) | milvus_querynode_entity_num | عدد الكيانات القابلة للاستعلام والبحث عنها في كل عقدة استعلام. |
قناة DML الافتراضية | عدد قنوات DML الافتراضية التي تتم مشاهدتها بواسطة كل عقدة استعلام. | sum(milvus_querynode_dml_vchannel_num{app_kubernetes_io_instance=~"$instance", app_kubernetes_io_name="$app_name", namespace="$namespace"}) by (pod, node_id) | milvus_querynode_dml_vchannel_num | عدد قنوات DML الافتراضية التي تشاهدها كل عقدة استعلام. |
قناة دلتا الافتراضية | عدد قنوات دلتا التي تشاهدها كل عقدة استعلام. | sum(milvus_querynode_delta_vchannel_num{app_kubernetes_io_instance=~"$instance", app_kubernetes_io_name="$app_name", namespace="$namespace"}) by (pod, node_id) | milvus_querynode_delta_vchannel_num | عدد قنوات دلتا التي تشاهدها كل عقدة استعلام. |
عدد المستهلكين | عدد المستهلكين في كل عقدة استعلام. | sum(milvus_querynode_consumer_num{app_kubernetes_io_instance=~"$instance", app_kubernetes_io_name="$app_name", namespace="$namespace"}) by (pod, node_id) | milvus_querynode_consumer_num | عدد المستهلكين في كل عقدة استعلام. |
معدل طلبات البحث | إجمالي عدد طلبات البحث والاستعلام التي تتلقاها كل عقدة استعلام في الثانية وعدد طلبات البحث والاستعلام الناجحة خلال الدقيقتين الماضيتين. | sum(increase(milvus_querynode_sq_req_count{app_kubernetes_io_instance=~"$instance", app_kubernetes_io_name="$app_name", namespace="$namespace"}[2m])/120) by (query_type, status, pod, node_id) | milvus_querynode_sq_req_count | العدد المتراكم لطلبات البحث والاستعلام. |
زمن انتقال طلب البحث | متوسط زمن الاستجابة والنسبة المئوية الـ 99 للوقت المستخدم في طلبات البحث والاستعلام من قبل كل عقدة استعلام خلال الدقيقتين الماضيتين. تعرض هذه اللوحة زمن انتقال طلبات البحث والاستعلام التي تكون حالتها "نجاح" أو "إجمالي". | p99: histogram_quantile(0.99, sum by (le, pod, node_id) (rate(milvus_querynode_sq_req_latency_bucket{app_kubernetes_io_instance=~"$instance", app_kubernetes_io_name="$app_name", namespace="$namespace"}[2m]))) متوسط: sum(increase(milvus_querynode_sq_req_latency_sum{app_kubernetes_io_instance=~"$instance", app_kubernetes_io_name="$app_name", namespace="$namespace"}[2m])) by(pod, node_id, query_type) / sum(increase(milvus_querynode_sq_req_latency_count{app_kubernetes_io_instance=~"$instance", app_kubernetes_io_name="$app_name", namespace="$namespace"}[2m])) by(pod, node_id, query_type) | milvus_querynode_sq_req_latency | زمن انتقال طلب البحث لعقدة الاستعلام. |
زمن انتقال البحث في قائمة الانتظار | متوسط زمن الكمون والنسبة المئوية الـ 99 لزمن انتقال طلبات البحث والاستعلام في قائمة الانتظار خلال الدقيقتين الماضيتين. | p99: histogram_quantile(0.99, sum by (le, pod, node_id, query_type) (rate(milvus_querynode_sq_queue_latency_bucket{app_kubernetes_io_instance=~"$instance", app_kubernetes_io_name="$app_name", namespace="$namespace"}[2m]))) متوسط: sum(increase(milvus_querynode_sq_queue_latency_sum{app_kubernetes_io_instance=~"$instance", app_kubernetes_io_name="$app_name", namespace="$namespace"}[2m])) by(pod, node_id, query_type) / sum(increase(milvus_querynode_sq_queue_latency_count{app_kubernetes_io_instance=~"$instance", app_kubernetes_io_name="$app_name", namespace="$namespace"}[2m])) by(pod, node_id, query_type) | milvus_querynode_sq_queue_latency | زمن انتقال طلبات البحث والاستعلام المستلمة بواسطة عقدة الاستعلام. |
زمن انتقال جزء البحث | متوسط زمن الاستجابة والنسبة المئوية الـ 99 للوقت الذي تستغرقه كل عقدة استعلام للبحث والاستعلام عن مقطع خلال الدقيقتين الماضيتين. يمكن أن تكون حالة المقطع مختومة أو متزايدة. | p99: histogram_quantile(0.99, sum by (le, query_type, segment_state, pod, node_id) (rate(milvus_querynode_sq_segment_latency_bucket{app_kubernetes_io_instance=~"$instance", app_kubernetes_io_name="$app_name", namespace="$namespace"}[2m]))) avg: sum(increase(milvus_querynode_sq_segment_latency_sum{app_kubernetes_io_instance=~"$instance", app_kubernetes_io_name="$app_name", namespace="$namespace"}[2m])) by(pod, node_id, query_type, segment_state) / sum(increase(milvus_querynode_sq_segment_latency_count{app_kubernetes_io_instance=~"$instance", app_kubernetes_io_name="$app_name", namespace="$namespace"}[2m])) by(pod, node_id, query_type, segment_state) | milvus_querynode_sq_segment_latency | الوقت الذي تستغرقه كل عقدة استعلام للبحث والاستعلام عن كل مقطع. |
زمن انتقال طلب سيجكور | متوسط زمن الاستجابة والنسبة المئوية الـ 99 للوقت الذي تستغرقه كل عقدة استعلام للبحث والاستعلام في segcore خلال الدقيقتين الماضيتين. | p99: histogram_quantile(0.99, sum by (le, query_type, pod, node_id) (rate(milvus_querynode_sq_core_latency_bucket{app_kubernetes_io_instance=~"$instance", app_kubernetes_io_name="$app_name", namespace="$namespace"}[2m]))) متوسط: sum(increase(milvus_querynode_sq_core_latency_sum{app_kubernetes_io_instance=~"$instance", app_kubernetes_io_name="$app_name", namespace="$namespace"}[2m])) by(pod, node_id, query_type) / sum(increase(milvus_querynode_sq_core_latency_count{app_kubernetes_io_instance=~"$instance", app_kubernetes_io_name="$app_name", namespace="$namespace"}[2m])) by(pod, node_id, query_type) | milvus_querynode_sq_core_latency | الوقت الذي تستغرقه كل عقدة استعلام للبحث والاستعلام في segcore. |
زمن انتقال تقليل البحث | متوسط زمن الاستجابة والنسبة المئوية الـ 99 للوقت الذي تستغرقه كل عقدة استعلام خلال مرحلة تقليل البحث أو الاستعلام خلال الدقيقتين الماضيتين. | p99: histogram_quantile(0.99, sum by (le, pod, node_id, query_type) (rate(milvus_querynode_sq_reduce_latency_bucket{app_kubernetes_io_instance=~"$instance", app_kubernetes_io_name="$app_name", namespace="$namespace"}[2m]))) متوسط: sum(increase(milvus_querynode_sq_reduce_latency_sum{app_kubernetes_io_instance=~"$instance", app_kubernetes_io_name="$app_name", namespace="$namespace"}[2m])) by(pod, node_id, query_type) / sum(increase(milvus_querynode_sq_reduce_latency_count{app_kubernetes_io_instance=~"$instance", app_kubernetes_io_name="$app_name", namespace="$namespace"}[2m])) by(pod, node_id, query_type) | milvus_querynode_sq_reduce_latency | الوقت الذي يقضيه كل استعلام خلال مرحلة الاختزال. |
زمن انتقال جزء التحميل | متوسط زمن الاستجابة والنسبة المئوية الـ 99 للوقت الذي تستغرقه كل عقدة استعلام لتحميل مقطع خلال الدقيقتين الماضيتين. | p99: histogram_quantile(0.99, sum by (le, pod, node_id) (rate(milvus_querynode_load_segment_latency_bucket{app_kubernetes_io_instance=~"$instance", app_kubernetes_io_name="$app_name", namespace="$namespace"}[2m]))) متوسط: sum(increase(milvus_querynode_load_segment_latency_sum{app_kubernetes_io_instance=~"$instance", app_kubernetes_io_name="$app_name", namespace="$namespace"}[2m])) by(pod, node_id) / sum(increase(milvus_querynode_load_segment_latency_count{app_kubernetes_io_instance=~"$instance", app_kubernetes_io_name="$app_name", namespace="$namespace"}[2m])) by(pod, node_id) | milvus_querynode_load_segment_latency_bucket | الوقت الذي تستغرقه كل عقدة استعلام لتحميل مقطع. |
عدد مخططات التدفق | عدد مخططات التدفق في كل عقدة استعلام. | sum(milvus_querynode_flowgraph_num{app_kubernetes_io_instance=~"$instance", app_kubernetes_io_name="$app_name", namespace="$namespace"}) by (pod, node_id) | milvus_querynode_flowgraph_num | عدد مخططات التدفق في كل عقدة استعلام. |
طول مهمة القراءة غير المحلولة | طول قائمة انتظار طلبات القراءة التي لم يتم حلها في كل عقدة استعلام. | sum(milvus_querynode_read_task_unsolved_len{app_kubernetes_io_instance=~"$instance", app_kubernetes_io_name="$app_name", namespace="$namespace"}) by (pod, node_id) | milvus_querynode_read_task_unsolved_len | طول قائمة انتظار طلبات القراءة التي لم يتم حلها. |
طول مهمة القراءة الجاهزة | طول قائمة انتظار طلبات القراءة التي سيتم تنفيذها في كل عقدة استعلام. | sum(milvus_querynode_read_task_ready_len{app_kubernetes_io_instance=~"$instance", app_kubernetes_io_name="$app_name", namespace="$namespace"}) by (pod, node_id) | milvus_querynode_read_task_ready_len | طول قائمة انتظار طلبات القراءة المطلوب تنفيذها. |
عدد مهام القراءة المتوازية | عدد طلبات القراءة المتزامنة المنفذة حالياً في كل عقدة استعلام. | sum(milvus_querynode_read_task_concurrency{app_kubernetes_io_instance=~"$instance", app_kubernetes_io_name="$app_name", namespace="$namespace"}) by (pod, node_id) | milvus_querynode_read_task_concurrency | عدد طلبات القراءة المتزامنة المنفذة حالياً. |
تقدير استخدام وحدة المعالجة المركزية | استخدام وحدة المعالجة المركزية (CPU) من قبل كل عقدة استعلام مقدرة من قبل المجدول. | sum(milvus_querynode_estimate_cpu_usage{app_kubernetes_io_instance=~"$instance", app_kubernetes_io_name="$app_name", namespace="$namespace"}) by (pod, node_id) | milvus_querynode_estimate_cpu_usage | استخدام وحدة المعالجة المركزية من قبل كل عقدة استعلام مقدرة من قبل المجدول. عندما تكون القيمة 100، فهذا يعني استخدام وحدة معالجة مركزية افتراضية كاملة (vCPU). |
حجم مجموعة البحث | متوسط العدد والنسبة المئوية 99 لحجم مجموعة البحث (أي العدد الإجمالي لطلبات البحث الأصلية في طلبات البحث المجمعة التي تم تنفيذها بواسطة كل عقدة استعلام) خلال الدقيقتين الماضيتين. | p99: histogram_quantile(0.99, sum by (le, pod, node_id) (rate(milvus_querynode_search_group_size_bucket{app_kubernetes_io_instance=~"$instance", app_kubernetes_io_name="$app_name", namespace="$namespace"}[2m]))) متوسط: sum(increase(milvus_querynode_search_group_size_sum{app_kubernetes_io_instance=~"$instance", app_kubernetes_io_name="$app_name", namespace="$namespace"}[2m])) by(pod, node_id) / sum(increase(milvus_querynode_search_group_size_count{app_kubernetes_io_instance=~"$instance", app_kubernetes_io_name="$app_name", namespace="$namespace"}[2m])) by(pod, node_id) | milvus_querynode_load_segment_latency_bucket | عدد مهام البحث الأصلية من بين مهام البحث المجمعة من مجموعات مختلفة (أي حجم مجموعة البحث). |
البحث NQ | متوسط العدد والنسبة المئوية الـ 99 لعدد الاستعلامات (NQ) التي تم إجراؤها أثناء تنفيذ كل عقدة استعلام لطلبات البحث خلال الدقيقتين الماضيتين. | p99: histogram_quantile(0.99, sum by (le, pod, node_id) (rate(milvus_querynode_search_group_size_bucket{app_kubernetes_io_instance=~"$instance", app_kubernetes_io_name="$app_name", namespace="$namespace"}[2m]))) متوسط: sum(increase(milvus_querynode_search_group_size_sum{app_kubernetes_io_instance=~"$instance", app_kubernetes_io_name="$app_name", namespace="$namespace"}[2m])) by(pod, node_id) / sum(increase(milvus_querynode_search_group_size_count{app_kubernetes_io_instance=~"$instance", app_kubernetes_io_name="$app_name", namespace="$namespace"}[2m])) by(pod, node_id) | milvus_querynode_querynode_seload_segment_latency_bucket | عدد الاستعلامات (NQ) لطلبات البحث. |
مجموعة البحث NQ | متوسط العدد والنسبة المئوية الـ 99 لـ NQ لطلبات البحث مجتمعة والمنفذة بواسطة كل عقدة استعلام خلال الدقيقتين الماضيتين. | p99: histogram_quantile(0.99, sum by (le, pod, node_id) (rate(milvus_querynode_search_group_nq_bucket{app_kubernetes_io_instance=~"$instance", app_kubernetes_io_name="$app_name", namespace="$namespace"}[2m]))) متوسط: sum(increase(milvus_querynode_search_group_nq_sum{app_kubernetes_io_instance=~"$instance", app_kubernetes_io_name="$app_name", namespace="$namespace"}[2m])) by(pod, node_id) / sum(increase(milvus_querynode_search_group_nq_count{app_kubernetes_io_instance=~"$instance", app_kubernetes_io_name="$app_name", namespace="$namespace"}[2m])) by(pod, node_id) | milvus_querynode_load_segment_latency_bucket | NQ لطلبات البحث مجتمعة من مجموعات مختلفة. |
البحث الأعلى_ك | متوسط العدد والنسبة المئوية الـ 99 من Top_K لطلبات البحث المنفذة بواسطة كل عقدة استعلام خلال الدقيقتين الماضيتين. | p99: histogram_quantile(0.99, sum by (le, pod, node_id) (rate(milvus_querynode_search_topk_bucket{app_kubernetes_io_instance=~"$instance", app_kubernetes_io_name="$app_name", namespace="$namespace"}[2m]))) avg: sum(increase(milvus_querynode_search_topk_sum{app_kubernetes_io_instance=~"$instance", app_kubernetes_io_name="$app_name", namespace="$namespace"}[2m])) by(pod, node_id) / sum(increase(milvus_querynode_search_topk_count{app_kubernetes_io_instance=~"$instance", app_kubernetes_io_name="$app_name", namespace="$namespace"}[2m])) by(pod, node_id) | milvus_querynode_load_segment_latency_bucket | Top_K لطلبات البحث |
مجموعة البحث Top_K | متوسط العدد والنسبة المئوية الـ 99 من Top_K من طلبات البحث مجتمعة والمنفذة بواسطة كل عقدة استعلام خلال الدقيقتين الماضيتين. | p99: histogram_quantile(0.99, sum by (le, pod, node_id) (rate(milvus_querynode_search_group_topk_bucket{app_kubernetes_io_instance=~"$instance", app_kubernetes_io_name="$app_name", namespace="$namespace"}[2m]))) avg: sum(increase(milvus_querynode_search_group_topk_sum{app_kubernetes_io_instance=~"$instance", app_kubernetes_io_name="$app_name", namespace="$namespace"}[2m])) by(pod, node_id) / sum(increase(milvus_querynode_search_group_topk_count{app_kubernetes_io_instance=~"$instance", app_kubernetes_io_name="$app_name", namespace="$namespace"}[2m])) by(pod, node_id) | milvus_querynode_load_segment_latency_bucket | Top_K من طلبات البحث مجتمعة من مجموعات مختلفة . |
معدل طلبات القراءة التي تم إخلاؤها | عدد طلبات القراءة التي تم إخلاؤها في الثانية الواحدة بواسطة كل عقدة استعلام خلال الدقيقتين الماضيتين. | sum(increase(milvus_querynode_read_evicted_count{app_kubernetes_io_instance=~"$instance", app_kubernetes_io_name="$app_name", namespace="$namespace"}[2m])/120) by (pod, node_id) | milvus_querynode_sq_req_count | العدد المتراكم لطلبات القراءة التي تم إخلاؤها بواسطة عقدة الاستعلام بسبب تقييد حركة المرور. |
منسق البيانات
لوحة | وصف اللوحة | PromQL (لغة استعلام Prometheus) | مقاييس ميلفوس المستخدمة | وصف مقاييس ميلفوس |
---|---|---|---|---|
عدد عقد البيانات | عدد عقد البيانات التي يديرها منسق البيانات. | sum(milvus_datacoord_datanode_num{app_kubernetes_io_instance=~"$instance", app_kubernetes_io_name="$app_name", namespace="$namespace"}) by (app_kubernetes_io_instance) | milvus_datacoord_datanode_num | عدد عقد البيانات التي يديرها منسق البيانات. |
عدد المقاطع | عدد جميع أنواع المقاطع المسجلة في البيانات الوصفية بواسطة منسق البيانات. | sum(milvus_datacoord_segment_num{app_kubernetes_io_instance=~"$instance", app_kubernetes_io_name="$app_name", namespace="$namespace"}) by (segment_state) | milvus_datacoord_segment_num | عدد جميع أنواع المقاطع المسجلة في البيانات الوصفية بواسطة منسق البيانات. تتضمن أنواع المقاطع ما يلي: تم إسقاطها، ومسحها، ومسحها، وتناميها، وإغلاقها. |
عدد المجموعات | عدد المجموعات المسجلة في البيانات الوصفية حسب تنسيق البيانات. | sum(milvus_datacoord_collection_num{app_kubernetes_io_instance=~"$instance", app_kubernetes_io_name="$app_name", namespace="$namespace"}) by (app_kubernetes_io_instance) | milvus_datacoord_collection_num | عدد المجموعات المسجلة في البيانات الوصفية حسب تنسيق البيانات. |
الصفوف المخزنة | العدد المتراكم لصفوف البيانات الصالحة والمسحوبة في تنسيق البيانات. | sum(milvus_datacoord_stored_rows_num{app_kubernetes_io_instance=~"$instance", app_kubernetes_io_name="$app_name", namespace="$namespace"}) by (app_kubernetes_io_instance) | milvus_datacoord_stored_rows_num | العدد المتراكم لصفوف البيانات الصالحة والمسحوبة في تنسيق البيانات. |
معدل الصفوف المخزنة | متوسط عدد الصفوف التي تم مسحها في الثانية خلال الدقيقتين الماضيتين. | sum(increase(milvus_datacoord_stored_rows_count{app_kubernetes_io_instance=~"$instance", app_kubernetes_io_name="$app_name", namespace="$namespace"}[2m])/120) by (pod, node_id) | milvus_datacoord_stored_rows_count | العدد المتراكم للصفوف التي تم مسحها بواسطة تنسيق البيانات. |
وقت المزامنة | متوسط، والحد الأقصى، والحد الأدنى لعدد زمن الحقبة الزمنية التي تمت مزامنتها بواسطة تنسيق البيانات في كل قناة فعلية. | avg(milvus_datacoord_sync_epoch_time{app_kubernetes_io_instance=~"$instance", app_kubernetes_io_name="$app_name", namespace="$namespace"}) by (app_kubernetes_io_instance) max(milvus_datacoord_sync_epoch_time{app_kubernetes_io_instance=~"$instance", app_kubernetes_io_name="$app_name", namespace="$namespace"}) by (app_kubernetes_io_instance) min(milvus_datacoord_sync_epoch_time{app_kubernetes_io_instance=~"$instance", app_kubernetes_io_name="$app_name", namespace="$namespace"}) by (app_kubernetes_io_instance) | milvus_datacoord_sync_epoch_time | زمن الحقبة الزمنية لكل قناة فعلية (توقيت يونيكس، الميلي ثانية التي مرت منذ 1 يناير 1970). |
حجم مدونة البيانات المخزنة | الحجم الإجمالي لـ Binlog المخزنة. | sum(milvus_datacoord_stored_binlog_size{app_kubernetes_io_instance=~"$instance", app_kubernetes_io_name="$app_name", namespace="$namespace"}) by (app_kubernetes_io_instance) | milvus_datacoord_stored_binlog_size | الحجم الكلي لـ Binlog المخزنة في ميلفوس. |
عقدة البيانات
لوحة | وصف اللوحة | PromQL (لغة استعلام Prometheus) | مقاييس ملفوس المستخدمة | وصف مقاييس ميلفوس |
---|---|---|---|---|
رقم مخطط التدفق | عدد كائنات مخطط التدفق التي تتوافق مع كل عقدة بيانات. | sum(milvus_datanode_flowgraph_num{app_kubernetes_io_instance=~"$instance", app_kubernetes_io_name="$app_name", namespace="$namespace"}) by (pod, node_id) | milvus_datanode_flowgraph_num | عدد كائنات مخطط التدفق. كل جزء في المجموعة يتوافق مع كائن مخطط انسيابي. |
معدل استهلاك صفوف الرسائل | عدد صفوف رسائل التدفق المستهلكة لكل ثانية بواسطة كل عقدة بيانات خلال الدقيقتين الماضيتين. | sum(increase(milvus_datanode_msg_rows_count{app_kubernetes_io_instance=~"$instance", app_kubernetes_io_name="$app_name", namespace="$namespace"}[2m])/120) by (msg_type, pod, node_id) | milvus_datanode_msg_rows_count | عدد صفوف رسائل التدفق المستهلكة. حالياً، رسائل التدفق التي يتم حسابها بواسطة عقدة البيانات تتضمن فقط رسائل الإدراج والحذف. |
معدل حجم البيانات المتدفقة | حجم كل رسالة متدفقة يتم تسجيلها في الثانية من قبل كل عقدة بيانات خلال الدقيقتين الماضيتين. | sum(increase(milvus_datanode_flushed_data_size{app_kubernetes_io_instance=~"$instance", app_kubernetes_io_name="$app_name", namespace="$namespace"}[2m])/120) by (msg_type, pod, node_id) | milvus_datanode_flushed_data_size | حجم كل رسالة متدفقة. في الوقت الحالي، تتضمن رسائل التدفق المحسوبة بواسطة عقدة البيانات رسائل الإدراج والحذف فقط. |
عدد المستهلكين | عدد المستهلكين الذين تم إنشاؤهم على كل عقدة بيانات. | sum(milvus_datanode_consumer_num{app_kubernetes_io_instance=~"$instance", app_kubernetes_io_name="$app_name", namespace="$namespace"}) by (pod, node_id) | milvus_datanode_consumer_num | عدد المستهلكين الذين تم إنشاؤهم على كل عقدة بيانات. يتوافق كل مخطط تدفق مع مستهلك. |
عدد المنتجين | عدد المنتجين الذين تم إنشاؤهم على كل عقدة بيانات. | sum(milvus_datanode_producer_num{app_kubernetes_io_instance=~"$instance", app_kubernetes_io_name="$app_name", namespace="$namespace"}) by (pod, node_id) | milvus_datanode_producer_num | عدد المستهلكين الذين تم إنشاؤهم على كل عقدة بيانات. كل جزء في المجموعة يتوافق مع منتج قناة دلتا ومنتج قناة زمنية. |
وقت المزامنة | العدد المتوسط والحد الأقصى والأدنى لوقت الحقبة الزمنية التي تمت مزامنتها من قبل كل عقدة بيانات في جميع المواضيع الفعلية. | avg(milvus_datanode_sync_epoch_time{app_kubernetes_io_instance=~"$instance", app_kubernetes_io_name="$app_name", namespace="$namespace"}) by (pod, node_id) max(milvus_datanode_sync_epoch_time{app_kubernetes_io_instance=~"$instance", app_kubernetes_io_name="$app_name", namespace="$namespace"}) by (pod, node_id) min(milvus_datanode_sync_epoch_time{app_kubernetes_io_instance=~"$instance", app_kubernetes_io_name="$app_name", namespace="$namespace"}) by (pod, node_id) | milvus_datanode_sync_epoch_time | وقت الحقبة الزمنية (وقت يونيكس، أي الميلي ثانية التي مرت منذ 1 يناير 1970.) لكل موضوع فعلي في عقدة البيانات. |
عدد المقاطع غير الممسوحة | عدد المقاطع غير الممسوحة التي لم يتم مسحها على كل عقدة بيانات. | sum(milvus_datanode_unflushed_segment_num{app_kubernetes_io_instance=~"$instance", app_kubernetes_io_name="$app_name", namespace="$namespace"}) by (pod, node_id) | milvus_datanode_unflushed_segment_num | عدد المقاطع غير الممسوحة التي لم يتم مسحها على كل عقدة بيانات. |
زمن انتقال المخزن المؤقت للتشفير | متوسط زمن الاستجابة والنسبة المئوية ال 99 للوقت المستخدم لتشفير المخزن المؤقت بواسطة كل عقدة بيانات خلال الدقيقتين الماضيتين. | p99: histogram_quantile(0.99, sum by (le, pod, node_id) (rate(milvus_datanode_encode_buffer_latency_bucket{app_kubernetes_io_instance=~"$instance", app_kubernetes_io_name="$app_name", namespace="$namespace"}[2m]))) متوسط: sum(increase(milvus_datanode_encode_buffer_latency_sum{app_kubernetes_io_instance=~"$instance", app_kubernetes_io_name="$app_name", namespace="$namespace"}[2m])) by(pod, node_id) / sum(increase(milvus_datanode_encode_buffer_latency_count{app_kubernetes_io_instance=~"$instance", app_kubernetes_io_name="$app_name", namespace="$namespace"}[2m])) by(pod, node_id) | milvus_datanode_encode_buffer_latency | الوقت الذي تستغرقه كل عقدة بيانات لتشفير مخزن مؤقت. |
حفظ كمون البيانات | متوسط زمن الاستجابة والنسبة المئوية الـ 99 للوقت المستخدم لكتابة مخزن مؤقت في طبقة التخزين بواسطة كل عقدة بيانات خلال الدقيقتين الماضيتين. | p99: histogram_quantile(0.99, sum by (le, pod, node_id) (rate(milvus_datanode_save_latency_bucket{app_kubernetes_io_instance=~"$instance", app_kubernetes_io_name="$app_name", namespace="$namespace"}[2m]))) متوسط: sum(increase(milvus_datanode_save_latency_sum{app_kubernetes_io_instance=~"$instance", app_kubernetes_io_name="$app_name", namespace="$namespace"}[2m])) by(pod, node_id) / sum(increase(milvus_datanode_save_latency_count{app_kubernetes_io_instance=~"$instance", app_kubernetes_io_name="$app_name", namespace="$namespace"}[2m])) by(pod, node_id) | milvus_datanode_save_latency | الوقت الذي تستغرقه كل عقدة بيانات لكتابة مخزن مؤقت في طبقة التخزين. |
معدل تشغيل التدفق | عدد المرات التي تقوم فيها كل عقدة بيانات بمسح مخزن مؤقت في الثانية خلال الدقيقتين الماضيتين. | sum(increase(milvus_datanode_flush_buffer_op_count{app_kubernetes_io_instance=~"$instance", app_kubernetes_io_name="$app_name", namespace="$namespace"}[2m])/120) by (status, pod, node_id) | milvus_datanode_flush_buffer_op_count | عدد المرات المتراكمة التي تقوم فيها عقدة البيانات بمسح مخزن مؤقت. |
معدل تشغيل التدفق التلقائي | عدد المرات التي تقوم فيها كل عقدة بيانات بمسح المخزن المؤقت تلقائياً لكل ثانية خلال الدقيقتين الماضيتين. | sum(increase(milvus_datanode_autoflush_buffer_op_count{app_kubernetes_io_instance=~"$instance", app_kubernetes_io_name="$app_name", namespace="$namespace"}[2m])/120) by (status, pod, node_id) | milvus_datanode_autoflush_buffer_op_count | عدد المرات المتراكمة التي تقوم فيها عقدة بيانات بمسح المخزن المؤقت تلقائياً. |
معدل طلب التنظيف | عدد المرات التي تتلقى فيها كل عقدة بيانات طلب مسح المخزن المؤقت لكل ثانية خلال الدقيقتين الماضيتين. | sum(increase(milvus_datanode_flush_req_count{app_kubernetes_io_instance=~"$instance", app_kubernetes_io_name="$app_name", namespace="$namespace"}[2m])/120) by (status, pod, node_id) | milvus_datanode_flush_req_count | العدد المتراكم للمرات التي تتلقى فيها عقدة بيانات طلب مسح من منسق بيانات. |
زمن انتقال الضغط | متوسط زمن الاستجابة و99 النسبة المئوية للوقت الذي تستغرقه كل عقدة بيانات لتنفيذ مهمة ضغط خلال الدقيقتين الماضيتين. | p99: histogram_quantile(0.99, sum by (le, pod, node_id) (rate(milvus_datanode_compaction_latency_bucket{app_kubernetes_io_instance=~"$instance", app_kubernetes_io_name="$app_name", namespace="$namespace"}[2m]))) متوسط: sum(increase(milvus_datanode_compaction_latency_sum{app_kubernetes_io_instance=~"$instance", app_kubernetes_io_name="$app_name", namespace="$namespace"}[2m])) by(pod, node_id) / sum(increase(milvus_datanode_compaction_latency_count{app_kubernetes_io_instance=~"$instance", app_kubernetes_io_name="$app_name", namespace="$namespace"}[2m])) by(pod, node_id) | milvus_datanode_compaction_latency | الوقت الذي تستغرقه كل عقدة بيانات لتنفيذ مهمة ضغط. |
منسق الفهرس
لوحة | وصف اللوحة | PromQL (لغة استعلام Prometheus) | مقاييس ميلفوس المستخدمة | وصف مقاييس ميلفوس |
---|---|---|---|---|
معدل طلبات الفهرس | متوسط عدد طلبات بناء الفهرس المستلمة في الثانية خلال الدقيقتين الماضيتين. | sum(increase(milvus_indexcoord_indexreq_count{app_kubernetes_io_instance=~"$instance", app_kubernetes_io_name="$app_name", namespace="$namespace"}[2m])/120) by (status) | milvus_indexcoord_indexreq_count | عدد طلبات بناء الفهرس المستلمة. |
عدد مهام الفهرس | عدد جميع مهام الفهرسة المسجلة في البيانات الوصفية للفهرس. | sum(milvus_indexcoord_indextask_count{app_kubernetes_io_instance=~"$instance", app_kubernetes_io_name="$app_name", namespace="$namespace"}) by (index_task_status) | milvus_indexcoord_indextask_count | عدد كافة مهام الفهرسة المسجلة في البيانات الوصفية للفهرس. |
عدد عقد الفهرس | عدد عقد الفهرس المدارة. | sum(milvus_indexcoord_indexnode_num{app_kubernetes_io_instance=~"$instance", app_kubernetes_io_name="$app_name", namespace="$namespace"}) by (app_kubernetes_io_instance) | milvus_indexcoord_indexnode_num | عدد عقد الفهرس المدارة. |
عقدة الفهرس
لوحة | وصف اللوحة | PromQL (لغة استعلام Prometheus) | مقاييس ميلفوس المستخدمة | وصف مقاييس ميلفوس |
---|---|---|---|---|
معدل مهام الفهرس | متوسط عدد مهام بناء الفهرس المستلمة من قبل كل عقدة فهرس في الثانية خلال الدقيقتين الماضيتين. | sum(increase(milvus_indexnode_index_task_count{app_kubernetes_io_instance=~"$instance", app_kubernetes_io_name="$app_name", namespace="$namespace"}[2m])/120) by (status, pod, node_id) | milvus_indexnode_index_task_count | عدد مهام بناء الفهرس المستلمة. |
زمن انتقال حقل التحميل | متوسط زمن الوصول والنسبة المئوية الـ 99 للوقت الذي تستغرقه كل عقدة فهرس لتحميل بيانات حقل المقطع في كل مرة خلال الدقيقتين الماضيتين. | p99: histogram_quantile(0.99, sum by (le, pod, node_id) (rate(milvus_indexnode_load_field_latency_bucket{app_kubernetes_io_instance=~"$instance", app_kubernetes_io_name="$app_name", namespace="$namespace"}[2m]))) متوسط: sum(increase(milvus_indexnode_load_field_latency_sum{app_kubernetes_io_instance=~"$instance", app_kubernetes_io_name="$app_name", namespace="$namespace"}[2m])) by(pod, node_id) / sum(increase(milvus_indexnode_load_field_latency_count{app_kubernetes_io_instance=~"$instance", app_kubernetes_io_name="$app_name", namespace="$namespace"}[2m])) by(pod, node_id) | milvus_indexnode_load_field_latency | الوقت الذي تستخدمه عقدة الفهرس لتحميل بيانات حقل المقطع. |
زمن انتقال حقل فك التشفير | متوسط زمن الاستجابة والنسبة المئوية الـ 99 للوقت الذي تستخدمه كل عقدة فهرس لتشفير بيانات الحقل في كل مرة خلال الدقيقتين الماضيتين. | p99: histogram_quantile(0.99, sum by (le, pod, node_id) (rate(milvus_indexnode_decode_field_latency_bucket{app_kubernetes_io_instance=~"$instance", app_kubernetes_io_name="$app_name", namespace="$namespace"}[2m]))) متوسط: sum(increase(milvus_indexnode_decode_field_latency_sum{app_kubernetes_io_instance=~"$instance", app_kubernetes_io_name="$app_name", namespace="$namespace"}[2m])) by(pod, node_id) / sum(increase(milvus_indexnode_decode_field_latency_count{app_kubernetes_io_instance=~"$instance", app_kubernetes_io_name="$app_name", namespace="$namespace"}[2m])) by(pod, node_id) | milvus_indexnode_decode_field_latency | الوقت المستخدم لفك تشفير بيانات الحقل. |
كمون بناء الفهرس | متوسط زمن الاستجابة والنسبة المئوية 99 للوقت الذي استخدمته كل عقدة فهرس لبناء الفهارس خلال الدقيقتين الماضيتين. | p99: histogram_quantile(0.99, sum by (le, pod, node_id) (rate(milvus_indexnode_build_index_latency_bucket{app_kubernetes_io_instance=~"$instance", app_kubernetes_io_name="$app_name", namespace="$namespace"}[2m]))) متوسط: sum(increase(milvus_indexnode_build_index_latency_sum{app_kubernetes_io_instance=~"$instance", app_kubernetes_io_name="$app_name", namespace="$namespace"}[2m])) by(pod, node_id) / sum(increase(milvus_indexnode_build_index_latency_count{app_kubernetes_io_instance=~"$instance", app_kubernetes_io_name="$app_name", namespace="$namespace"}[2m])) by(pod, node_id) | milvus_indexnode_build_index_latency | الوقت المستخدم لبناء الفهارس. |
زمن انتقال فهرس التشفير | متوسط زمن الاستجابة والنسبة المئوية 99 للوقت الذي استخدمته كل عقدة فهرس لتشفير ملفات الفهرس خلال الدقيقتين الماضيتين. | p99: histogram_quantile(0.99, sum by (le, pod, node_id) (rate(milvus_indexnode_encode_index_latency_bucket{app_kubernetes_io_instance=~"$instance", app_kubernetes_io_name="$app_name", namespace="$namespace"}[2m]))) متوسط: sum(increase(milvus_indexnode_encode_index_latency_sum{app_kubernetes_io_instance=~"$instance", app_kubernetes_io_name="$app_name", namespace="$namespace"}[2m])) by(pod, node_id) / sum(increase(milvus_indexnode_encode_index_latency_count{app_kubernetes_io_instance=~"$instance", app_kubernetes_io_name="$app_name", namespace="$namespace"}[2m])) by(pod, node_id) | milvus_indexnode_encode_index_latency | الوقت المستخدم لتشفير ملفات الفهرس. |
حفظ كمون الفهرس | متوسط زمن الاستجابة والنسبة المئوية 99 للوقت المستخدم من قبل كل عقدة فهرس لحفظ ملفات الفهرس خلال الدقيقتين الماضيتين. | p99: histogram_quantile(0.99, sum by (le, pod, node_id) (rate(milvus_indexnode_save_index_latency_bucket{app_kubernetes_io_instance=~"$instance", app_kubernetes_io_name="$app_name", namespace="$namespace"}[2m]))) متوسط الوقت: sum(increase(milvus_indexnode_save_index_latency_sum{app_kubernetes_io_instance=~"$instance", app_kubernetes_io_name="$app_name", namespace="$namespace"}[2m])) by(pod, node_id) / sum(increase(milvus_indexnode_save_index_latency_count{app_kubernetes_io_instance=~"$instance", app_kubernetes_io_name="$app_name", namespace="$namespace"}[2m])) by(pod, node_id) | milvus_indexnode_save_index_latency | الوقت المستخدم لحفظ ملفات الفهرس. |