🚀 جرب Zilliz Cloud، الـ Milvus المدارة بالكامل، مجاناً — تجربة أداء أسرع بـ 10 أضعاف! جرب الآن>>

milvus-logo
LFAI
الصفحة الرئيسية
  • دليل الإدارة
  • Home
  • Docs
  • دليل الإدارة

  • المراقبة والتنبيهات والسجلات

  • الرصد

  • لوحة قياس ميلفوس ميتركس

لوحة معلومات مقاييس ميلفوس

يُخرج Milvus قائمة بمقاييس مفصلة متسلسلة زمنيًا أثناء وقت التشغيل. يمكنك استخدام Prometheus و Grafana لتصور المقاييس. يقدم هذا الموضوع مقاييس المراقبة المعروضة في لوحة عدادات Grafana Milvus Dashboard.

وحدة الوقت في هذا الموضوع هي المللي ثانية. وتشير "النسبة المئوية 99 في المائة" في هذا الموضوع إلى حقيقة أن 99 في المائة من إحصائيات الوقت يتم التحكم فيها ضمن قيمة معينة.

نوصي بقراءة نظرة عامة على إطار عمل مراقبة Milvus لفهم مقاييس Prometheus أولاً.

الوكيل

لوحةوصف اللوحةPromQL (لغة استعلام Prometheus)مقاييس ميلفوس المستخدمةوصف مقاييس ميلفوس
معدل عدد ناقلات البحثمتوسط عدد المتجهات التي تم الاستعلام عنها في الثانية من قبل كل وكيل خلال الدقيقتين الماضيتين.sum(increase(milvus_proxy_search_vectors_count{app_kubernetes_io_instance=~"$instance", app_kubernetes_io_name="$app_name", namespace="$namespace"}[2m])/120) by (pod, node_id)milvus_proxy_search_vectors_countالعدد المتراكم للمتجهات التي تم الاستعلام عنها.
معدل عدد ناقلات الإدراجمتوسط عدد النواقل التي تم إدراجها في الثانية الواحدة بواسطة كل وكيل خلال الدقيقتين الماضيتين.sum(increase(milvus_proxy_insert_vectors_count{app_kubernetes_io_instance=~"$instance", app_kubernetes_io_name="$app_name", namespace="$namespace"}[2m])/120) by (pod, node_id)milvus_proxy_insert_vectors_countالعدد المتراكم للناقلات التي تم إدراجها.
زمن انتقال البحثمتوسط زمن الاستجابة والنسبة المئوية الـ 99 من زمن الاستجابة لتلقي طلبات البحث والاستعلام من قبل كل وكيل خلال الدقيقتين الماضيتين.p99:
histogram_quantile(0.99, sum by (le, query_type, pod, node_id) (rate(milvus_proxy_sq_latency_bucket{app_kubernetes_io_instance=~"$instance", app_kubernetes_io_name="$app_name", namespace="$namespace"}[2m])))
avg:
sum(increase(milvus_proxy_sq_latency_sum{app_kubernetes_io_instance=~"$instance", app_kubernetes_io_name="$app_name", namespace="$namespace"}[2m])) by (pod, node_id, query_type) / sum(increase(milvus_proxy_sq_latency_count{app_kubernetes_io_instance=~"$instance", app_kubernetes_io_name="$app_name", namespace="$namespace"}[2m])) by (pod, node_id, query_type)
milvus_proxy_sq_latencyزمن انتقال طلبات البحث والاستعلام.
زمن انتقال بحث المجموعةمتوسط زمن الاستجابة والنسبة المئوية الـ 99 لزمن الاستجابة لتلقي طلبات البحث والاستعلام إلى مجموعة محددة بواسطة كل وكيل خلال الدقيقتين الماضيتين.p99:
histogram_quantile(0.99, sum by (le, query_type, pod, node_id) (rate(milvus_proxy_collection_sq_latency_bucket{app_kubernetes_io_instance=~"$instance", app_kubernetes_io_name="$app_name", namespace="$namespace", collection_name=~"$collection"}[2m])))
avg:
sum(increase(milvus_proxy_collection_sq_latency_sum{app_kubernetes_io_instance=~"$instance", app_kubernetes_io_name="$app_name", namespace="$namespace", collection_name=~"$collection"}[2m])) by (pod, node_id, query_type) / sum(increase(milvus_proxy_collection_sq_latency_count{app_kubernetes_io_instance=~"$instance", app_kubernetes_io_name="$app_name", namespace="$namespace", collection_name=~"$collection"}[2m])) by (pod, node_id, query_type)
milvus_proxy_collection_sq_latency_sumزمن الوصول لطلبات البحث والاستعلام إلى مجموعة محددة من قبل كل وكيل
زمن الانتقالمتوسط زمن الكمون والنسبة المئوية الـ 99 لزمن الاستجابة لطلبات الطفرات من قبل كل وكيل خلال الدقيقتين الماضيتين.p99:
histogram_quantile(0.99, sum by (le, msg_type, pod, node_id) (rate(milvus_proxy_mutation_latency_bucket{app_kubernetes_io_instance=~"$instance", app_kubernetes_io_name="$app_name", namespace="$namespace"}[2m])))
avg:
sum(increase(milvus_proxy_mutation_latency_sum{app_kubernetes_io_instance=~"$instance", app_kubernetes_io_name="$app_name", namespace="$namespace"}[2m])) by (pod, node_id, msg_type) / sum(increase(milvus_proxy_mutation_latency_count{app_kubernetes_io_instance=~"$instance", app_kubernetes_io_name="$app_name", namespace="$namespace"}[2m])) by (pod, node_id, msg_type)
milvus_proxy_mutation_latency_sumزمن انتقال طلبات الطفرات.
زمن انتقال مجموعة الطفراتمتوسط زمن الاستجابة والنسبة المئوية الـ 99 لزمن الاستجابة لتلقي طلبات الطفرات إلى مجموعة محددة من قبل كل وكيل خلال الدقيقتين الماضيتين.p99:
histogram_quantile(0.99, sum by (le, query_type, pod, node_id) (rate(milvus_proxy_collection_sq_latency_bucket{app_kubernetes_io_instance=~"$instance", app_kubernetes_io_name="$app_name", namespace="$namespace", collection_name=~"$collection"}[2m])))
متوسط:
sum(increase(milvus_proxy_collection_sq_latency_sum{app_kubernetes_io_instance=~"$instance", app_kubernetes_io_name="$app_name", namespace="$namespace", collection_name=~"$collection"}[2m])) by (pod, node_id, query_type) / sum(increase(milvus_proxy_collection_sq_latency_count{app_kubernetes_io_instance=~"$instance", app_kubernetes_io_name="$app_name", namespace="$namespace", collection_name=~"$collection"}[2m])) by (pod, node_id, query_type)
milvus_proxy_collection_sq_latency_sumزمن انتقال طلبات الطفرات إلى مجموعة محددة
زمن انتظار نتائج البحثمتوسط زمن الاستجابة والنسبة المئوية الـ 99 لزمن الاستجابة بين إرسال طلبات البحث والاستعلام وتلقي النتائج بواسطة الوكيل خلال الدقيقتين الماضيتين.p99:
histogram_quantile(0.99, sum by (le, query_type, pod, node_id) (rate(milvus_proxy_sq_wait_result_latency_bucket{app_kubernetes_io_instance=~"$instance", app_kubernetes_io_name="$app_name", namespace="$namespace"}[2m])))
avg:
sum(increase(milvus_proxy_sq_wait_result_latency_sum{app_kubernetes_io_instance=~"$instance", app_kubernetes_io_name="$app_name", namespace="$namespace"}[2m])) by (pod, node_id, query_type) / sum(increase(milvus_proxy_sq_wait_result_latency_count{app_kubernetes_io_instance=~"$instance", app_kubernetes_io_name="$app_name", namespace="$namespace"}[2m])) by (pod, node_id, query_type)
milvus_proxy_sq_wait_result_latencyزمن الاستجابة بين إرسال طلبات البحث والاستعلام واستلام النتائج.
تقليل زمن انتقال نتائج البحثمتوسط زمن الاستجابة والنسبة المئوية الـ 99 لزمن الاستجابة لتجميع نتائج البحث والاستعلام عن طريق الوكيل خلال الدقيقتين الماضيتين.p99:
histogram_quantile(0.99, sum by (le, query_type, pod, node_id) (rate(milvus_proxy_sq_reduce_result_latency_bucket{app_kubernetes_io_instance=~"$instance", app_kubernetes_io_name="$app_name", namespace="$namespace"}[2m])))
متوسط:
sum(increase(milvus_proxy_sq_reduce_result_latency_sum{app_kubernetes_io_instance=~"$instance", app_kubernetes_io_name="$app_name", namespace="$namespace"}[2m])) by (pod, node_id, query_type) / sum(increase(milvus_proxy_sq_reduce_result_latency_count{app_kubernetes_io_instance=~"$instance", app_kubernetes_io_name="$app_name", namespace="$namespace"}[2m])) by (pod, node_id, query_type)
milvus_proxy_sq_reduce_result_latencyزمن انتقال تجميع نتائج البحث والاستعلام التي تم إرجاعها بواسطة كل عقدة استعلام.
زمن انتقال نتائج البحث عن طريق فك التشفيرمتوسط زمن الاستجابة والنسبة المئوية الـ 99 لزمن الاستجابة لفك تشفير نتائج البحث والاستعلام حسب الوكيل خلال الدقيقتين الماضيتين.p99:
histogram_quantile(0.99, sum by (le, query_type, pod, node_id) (rate(milvus_proxy_sq_decode_result_latency_bucket{app_kubernetes_io_instance=~"$instance", app_kubernetes_io_name="$app_name", namespace="$namespace"}[2m])))
متوسط:
sum(increase(milvus_proxy_sq_decode_result_latency_sum{app_kubernetes_io_instance=~"$instance", app_kubernetes_io_name="$app_name", namespace="$namespace"}[2m])) by (pod, node_id, query_type) / sum(increase(milvus_proxy_sq_decode_resultlatency_count{app_kubernetes_io_instance=~"$instance", app_kubernetes_io_name="$app_name", namespace="$namespace"}[2m])) by (pod, node_id, query_type)
milvus_proxy_sq_decode_result_latencyزمن الانتقال لفك تشفير كل نتيجة بحث واستعلام.
عدد كائنات دفق الرسائلمتوسط عدد كائنات دفق الرسائل والحد الأقصى والأدنى لعدد كائنات دفق الرسائل التي تم إنشاؤها بواسطة كل وكيل على الموضوع الفعلي المقابل له خلال الدقيقتين الماضيتين.avg(milvus_proxy_msgstream_obj_num{app_kubernetes_io_instance=~"$instance", app_kubernetes_io_name="$app_name", namespace="$namespace"}) by (pod, node_id) max(milvus_proxy_msgstream_obj_num{app_kubernetes_io_instance=~"$instance", app_kubernetes_io_name="$app_name", namespace="$namespace"}) by (pod, node_id) min(milvus_proxy_msgstream_obj_num{app_kubernetes_io_instance=~"$instance", app_kubernetes_io_name="$app_name", namespace="$namespace"}) by (pod, node_id)milvus_proxy_msgstream_obj_numعدد كائنات دفق الرسائل التي تم إنشاؤها على كل موضوع فعلي.
زمن انتقال إرسال الطفراتمتوسط زمن الكمون والنسبة المئوية الـ 99 لزمن انتقال إرسال طلبات الإدراج أو الحذف من قبل كل وكيل خلال الدقيقتين الماضيتين.p99:
histogram_quantile(0.99, sum by (le, msg_type, pod, node_id) (rate(milvus_proxy_mutation_send_latency_bucket{app_kubernetes_io_instance=~"$instance", app_kubernetes_io_name="$app_name", namespace="$namespace"}[2m])))
متوسط:
sum(increase(milvus_proxy_mutation_send_latency_sum{app_kubernetes_io_instance=~"$instance", app_kubernetes_io_name="$app_name", namespace="$namespace"}[2m])) by (pod, node_id, msg_type) / sum(increase(milvus_proxy_mutation_send_latency_count{app_kubernetes_io_instance=~"$instance", app_kubernetes_io_name="$app_name", namespace="$namespace"}[2m])) by (pod, node_id, msg_type)
milvus_proxy_mutation_send_latencyزمن الاستجابة لإرسال طلبات الإدراج أو الحذف.
معدل إصابة ذاكرة التخزين المؤقتمتوسط معدل إصابة ذاكرة التخزين المؤقت للعمليات بما في ذلك GeCollectionID و GetCollectionInfo و GetCollectionSchema في الثانية خلال الدقيقتين الماضيتين.sum(increase(milvus_proxy_cache_hit_count{app_kubernetes_io_instance=~"$instance", app_kubernetes_io_name="$app_name", namespace="$namespace", cache_state="hit"}[2m])/120) by(cache_name, pod, node_id) / sum(increase(milvus_proxy_cache_hit_count{app_kubernetes_io_instance=~"$instance", app_kubernetes_io_name="$app_name", namespace="$namespace"}[2m])/120) by(cache_name, pod, node_id)milvus_proxy_cache_hit_countإحصائيات معدل الإصابة والفشل لكل عملية قراءة في ذاكرة التخزين المؤقت.
زمن انتقال تحديث ذاكرة التخزين المؤقتمتوسط زمن الاستجابة والنسبة المئوية الـ 99 من زمن استجابة تحديث ذاكرة التخزين المؤقت حسب الوكيل خلال الدقيقتين الماضيتين.p99:
histogram_quantile(0.99, sum by (le, pod, node_id) (rate(milvus_proxy_cache_update_latency_bucket{app_kubernetes_io_instance=~"$instance", app_kubernetes_io_name="$app_name", namespace="$namespace"}[2m])))
متوسط:
sum(increase(milvus_proxy_cache_update_latency_sum{app_kubernetes_io_instance=~"$instance", app_kubernetes_io_name="$app_name", namespace="$namespace"}[2m])) by (pod, node_id) / sum(increase(milvus_proxy_cache_update_latency_count{app_kubernetes_io_instance=~"$instance", app_kubernetes_io_name="$app_name", namespace="$namespace"}[2m])) by (pod, node_id)
milvus_proxy_cache_update_latencyزمن انتقال تحديث ذاكرة التخزين المؤقت في كل مرة.
وقت المزامنةمتوسط عدد مرات المزامنة والحد الأقصى والأدنى لوقت الحقبة الزمنية التي تمت مزامنتها بواسطة كل وكيل في القناة الفعلية المقابلة له.avg(milvus_proxy_sync_epoch_time{app_kubernetes_io_instance=~"$instance", app_kubernetes_io_name="$app_name", namespace="$namespace"}) by (pod, node_id) max(milvus_proxy_sync_epoch_time{app_kubernetes_io_instance=~"$instance", app_kubernetes_io_name="$app_name", namespace="$namespace"}) by (pod, node_id) min(milvus_proxy_sync_epoch_time{app_kubernetes_io_instance=~"$instance", app_kubernetes_io_name="$app_name", namespace="$namespace"}) by (pod, node_id)milvus_proxy_sync_epoch_timeوقت الحقبة الزمنية لكل قناة فعلية (توقيت يونيكس، أي الميلي ثانية التي مرت منذ 1 يناير 1970).
يوجد ChannelName افتراضي بصرف النظر عن القنوات الفعلية.
تطبيق كمون PK الكمونمتوسط زمن الكمون والنسبة المئوية الـ 99 من زمن انتقال تطبيق المفتاح الأساسي لكل وكيل خلال الدقيقتين الماضيتين.p99:
histogram_quantile(0.99, sum by (le, pod, node_id) (rate(milvus_proxy_apply_pk_latency_bucket{app_kubernetes_io_instance=~"$instance", app_kubernetes_io_name="$app_name", namespace="$namespace"}[2m])))
avg:
sum(increase(milvus_proxy_apply_pk_latency_sum{app_kubernetes_io_instance=~"$instance", app_kubernetes_io_name="$app_name", namespace="$namespace"}[2m])) by (pod, node_id) / sum(increase(milvus_proxy_apply_pk_latency_count{app_kubernetes_io_instance=~"$instance", app_kubernetes_io_name="$app_name", namespace="$namespace"}[2m])) by (pod, node_id)
milvus_proxy_apply_pk_latencyزمن انتقال تطبيق المفتاح الأساسي.
زمن انتقال تطبيق الطابع الزمنيمتوسط زمن الانتقال والنسبة المئوية 99 لزمن انتقال تطبيق الطابع الزمني بواسطة كل وكيل خلال الدقيقتين الماضيتين.p99:
histogram_quantile(0.99, sum by (le, pod, node_id) (rate(milvus_proxy_apply_timestamp_latency_bucket{app_kubernetes_io_instance=~"$instance", app_kubernetes_io_name="$app_name", namespace="$namespace"}[2m])))
متوسط:
sum(increase(milvus_proxy_apply_timestamp_latency_sum{app_kubernetes_io_instance=~"$instance", app_kubernetes_io_name="$app_name", namespace="$namespace"}[2m])) by (pod, node_id) / sum(increase(milvus_proxy_apply_timestamp_latency_count{app_kubernetes_io_instance=~"$instance", app_kubernetes_io_name="$app_name", namespace="$namespace"}[2m])) by (pod, node_id)
milvus_proxy_apply_timestamp_latencyزمن انتقال تطبيق الطابع الزمني.
معدل نجاح الطلباتعدد الطلبات الناجحة التي يتلقاها كل وكيل في الثانية، مع تفصيل مفصل لكل نوع طلب. أنواع الطلبات المحتملة هي DescribeCollection، وDescribeIndex، وDiscribeIndex، وGetCollectionStatistics، وHasCollection، وHasCollection، وSearch، وSquery، وEhowPartitions، وIntrert، وما إلى ذلك.
sum(increase(milvus_proxy_req_count{app_kubernetes_io_instance=~"$instance", app_kubernetes_io_name="$app_name", namespace="$namespace", status="success"}[2m])/120) by(function_name, pod, node_id)milvus_proxy_req_countعدد جميع أنواع الطلبات المستلمة
معدل الطلبات الفاشلةعدد الطلبات الفاشلة التي يتلقاها كل وكيل في الثانية، مع تفصيل مفصل لكل نوع طلب. أنواع الطلبات المحتملة هي DescribeCollection، وDescribeIndex، وDiscribeIndex، وGetCollectionStatistics، وHasCollection، وSearch، وSquery، وEhowPartitions، وIntert، وما إلى ذلك.
sum(increase(milvus_proxy_req_count{app_kubernetes_io_instance=~"$instance", app_kubernetes_io_name="$app_name", namespace="$namespace", status="fail"}[2m])/120) by(function_name, pod, node_id)milvus_proxy_req_countعدد جميع أنواع الطلبات المستلمة
زمن انتقال الطلبمتوسط زمن الاستجابة والنسبة المئوية الـ 99 من زمن الاستجابة لجميع أنواع طلبات الاستقبال من قبل كل وكيلp99:
histogram_quantile(0.99, sum by (le, pod, node_id, function_name) (rate(milvus_proxy_req_latency_bucket{app_kubernetes_io_instance=~"$instance", app_kubernetes_io_name="$app_name", namespace="$namespace"}[2m])))
متوسط:
sum(increase(milvus_proxy_req_latency_sum{app_kubernetes_io_instance=~"$instance", app_kubernetes_io_name="$app_name", namespace="$namespace"}[2m])) by (pod, node_id, function_name) / sum(increase(milvus_proxy_req_latency_count{app_kubernetes_io_instance=~"$instance", app_kubernetes_io_name="$app_name", namespace="$namespace"}[2m])) by (pod, node_id, function_name)
milvus_proxy_req_latencyزمن الاستجابة لجميع أنواع طلبات الاستقبال
معدل بايتات طلبات الإدراج/الحذفعدد البايتات من طلبات الإدراج والحذف المستلمة في الثانية الواحدة بواسطة الوكيل خلال الدقيقتين الماضيتين.sum(increase(milvus_proxy_receive_bytes_count{app_kubernetes_io_instance=~"$instance", app_kubernetes_io_name="$app_name", namespace="$namespace"}[2m])/120) by(pod, node_id)milvus_proxy_receive_bytes_countعدد طلبات الإدراج والحذف.
معدل البايت المرسلةعدد وحدات البايت في الثانية المرسلة إلى العميل أثناء استجابة كل وكيل لطلبات البحث والاستعلام خلال الدقيقتين الماضيتين.sum(increase(milvus_proxy_send_bytes_count{app_kubernetes_io_instance=~"$instance", app_kubernetes_io_name="$app_name", namespace="$namespace"}[2m])/120) by(pod, node_id)milvus_proxy_send_bytes_countعدد وحدات البايت المرسلة مرة أخرى إلى العميل أثناء استجابة كل وكيل لطلبات البحث والاستعلام.

المنسق الجذر

لوحةوصف اللوحةPromQL (لغة استعلام Prometheus)مقاييس ميلفوس المستخدمةوصف مقاييس ميلفوس
عدد عقدة الوكيلعدد الوكلاء الذين تم إنشاؤهم.sum(milvus_rootcoord_proxy_num{app_kubernetes_io_instance=~"$instance", app_kubernetes_io_name="$app_name", namespace="$namespace"}) by (app_kubernetes_io_instance)milvus_rootcoord_proxy_numعدد الوكلاء.
وقت المزامنةمتوسط، والحد الأقصى، والحد الأدنى لوقت الحقبة الزمنية التي تمت مزامنتها من قبل كل منسق جذر في كل قناة فعلية (قناة PC).avg(milvus_rootcoord_sync_epoch_time{app_kubernetes_io_instance=~"$instance", app_kubernetes_io_name="$app_name", namespace="$namespace"}) by (app_kubernetes_io_instance) max(milvus_rootcoord_sync_epoch_time{app_kubernetes_io_instance=~"$instance", app_kubernetes_io_name="$app_name", namespace="$namespace"}) by (app_kubernetes_io_instance) min(milvus_rootcoord_sync_epoch_time{app_kubernetes_io_instance=~"$instance", app_kubernetes_io_name="$app_name", namespace="$namespace"}) by (app_kubernetes_io_instance)milvus_rootcoord_sync_epoch_timeزمن الحقبة الزمنية لكل قناة فعلية (توقيت يونيكس، الميلي ثانية التي مرت منذ 1 يناير 1970).
معدل طلبات DDLحالة وعدد طلبات DDL في الثانية خلال الدقيقتين الماضيتين.sum(increase(milvus_rootcoord_ddl_req_count{app_kubernetes_io_instance=~"$instance", app_kubernetes_io_name="$app_name", namespace="$namespace"}[2m])/120) by (status, function_name)milvus_rootcoord_ddl_req_countالعدد الإجمالي لطلبات DDL بما في ذلك CreateCollection و DescribeCollection و و DescribeSegments و HasCollection و ShowCollections و ShowPartitions و ShowSegments.
كمون طلب DDLمتوسط زمن الاستجابة والنسبة المئوية الـ 99 من زمن استجابة طلبات DDL خلال الدقيقتين الماضيتين.p99:
histogram_quantile(0.99, sum by (le, function_name) (rate(milvus_rootcoord_ddl_req_latency_bucket{app_kubernetes_io_instance=~"$instance", app_kubernetes_io_name="$app_name", namespace="$namespace"}[2m])))
avg:
sum(increase(milvus_rootcoord_ddl_req_latency_sum{app_kubernetes_io_instance=~"$instance", app_kubernetes_io_name="$app_name", namespace="$namespace"}[2m])) by (function_name) / sum(increase(milvus_rootcoord_ddl_req_latency_count{app_kubernetes_io_instance=~"$instance", app_kubernetes_io_name="$app_name", namespace="$namespace"}[2m])) by (function_name)
milvus_rootcoord_ddl_req_latencyزمن انتقال جميع أنواع طلبات DDL.
زمن الانتقال الزمني للمزامنةمتوسط زمن الاستجابة والنسبة المئوية الـ 99 للوقت الذي استخدمه جذر التنسيق لمزامنة جميع الطوابع الزمنية مع قناة PChannel خلال الدقيقتين الماضيتين.p99:
histogram_quantile(0.99, sum by (le) (rate(milvus_rootcoord_sync_timetick_latency_bucket{app_kubernetes_io_instance=~"$instance", app_kubernetes_io_name="$app_name", namespace="$namespace"}[2m])))
متوسط:
sum(increase(milvus_rootcoord_sync_timetick_latency_sum{app_kubernetes_io_instance=~"$instance", app_kubernetes_io_name="$app_name", namespace="$namespace"}[2m])) / sum(increase(milvus_rootcoord_sync_timetick_latency_count{app_kubernetes_io_instance=~"$instance", app_kubernetes_io_name="$app_name", namespace="$namespace"}[2m]))
milvus_rootcoord_sync_timetick_latencyالوقت الذي استخدمه جذر التنسيق لمزامنة جميع الطوابع الزمنية إلى قناة pchannel.
معدل تخصيص المعرفاتعدد المعرفات المعينة بواسطة جذر التنسيق في الثانية خلال الدقيقتين الماضيتين.sum(increase(milvus_rootcoord_id_alloc_count{app_kubernetes_io_instance=~"$instance", app_kubernetes_io_name="$app_name", namespace="$namespace"}[2m])/120)milvus_rootcoord_id_alloc_countالعدد المتراكم للمعرفات المعينة بواسطة جذر التنسيق.
الطابع الزمنيالطابع الزمني الأخير لنسق الجذر.milvus_rootcoord_timestamp{app_kubernetes_io_instance=~"$instance", app_kubernetes_io_name="$app_name", namespace="$namespace"}milvus_rootcoord_timestampالطابع الزمني الأخير لنسق الجذر.
الطابع الزمني المحفوظالطوابع الزمنية المعينة مسبقاً التي يحفظها جذر التنسيق في مخزن التعريف.milvus_rootcoord_timestamp_saved{app_kubernetes_io_instance=~"$instance", app_kubernetes_io_name="$app_name", namespace="$namespace"}milvus_rootcoord_timestamp_savedالطوابع الزمنية المعينة مسبقاً التي يحفظها جذر التنسيق في مخزن التعريف.
يتم تعيين الطوابع الزمنية المعينة مسبقاً قبل 3 ثوانٍ. ويتم تحديث الطابع الزمني وحفظه في مخزن التعريف كل 50 مللي ثانية.
عدد المجموعاتالعدد الإجمالي للمجموعات.sum(milvus_rootcoord_collection_num{app_kubernetes_io_instance=~"$instance", app_kubernetes_io_name="$app_name", namespace="$namespace"}) by (app_kubernetes_io_instance)milvus_rootcoord_collection_numإجمالي عدد المجموعات الموجودة في Milvus حالياً.
عدد الأقسامالعدد الإجمالي للأقسام.sum(milvus_rootcoord_partition_num{app_kubernetes_io_instance=~"$instance", app_kubernetes_io_name="$app_name", namespace="$namespace"}) by (app_kubernetes_io_instance)milvus_rootcoord_partition_numإجمالي عدد الأقسام الموجودة في Milvus حالياً.
عدد قنوات DMLإجمالي عدد قنوات DML.sum(milvus_rootcoord_dml_channel_num{app_kubernetes_io_instance=~"$instance", app_kubernetes_io_name="$app_name", namespace="$namespace"}) by (app_kubernetes_io_instance)milvus_rootcoord_dml_channel_numإجمالي عدد قنوات DML الموجودة في Milvus حالياً.
عدد قنوات msgstreamإجمالي عدد قنوات msgstreams.sum(milvus_rootcoord_msgstream_obj_num{app_kubernetes_io_instance=~"$instance", app_kubernetes_io_name="$app_name", namespace="$namespace"}) by (app_kubernetes_io_instance)milvus_rootcoord_msgstream_obj_numإجمالي عدد تدفقات الرسائل الموجودة في Milvus حالياً.
عدد بيانات الاعتمادإجمالي عدد بيانات الاعتماد.sum(milvus_rootcoord_credential_num{app_kubernetes_io_instance=~"$instance", app_kubernetes_io_name="$app_name", namespace="$namespace"}) by (app_kubernetes_io_instance)milvus_rootcoord_credential_numإجمالي عدد بيانات الاعتماد في Milvus حالياً.
تأخير تيك الوقتمجموع الحد الأقصى لتأخير التجزئة الزمنية القصوى للرسوم البيانية للتدفق على جميع عقد البيانات وعقد الاستعلام.sum(milvus_rootcoord_time_tick_delay{app_kubernetes_io_instance=~"$instance", app_kubernetes_io_name="$app_name", namespace="$namespace"}) by (app_kubernetes_io_instance)milvus_rootcoord_time_tick_delayالحد الأقصى لتأخير التجزئة الزمنية القصوى للرسوم البيانية للتدفق على كل DataNode وCueryNode.

منسق الاستعلام

لوحةوصف اللوحةPromQL (لغة استعلام Prometheus)مقاييس ميلفوس المستخدمةوصف مقاييس ميلفوس
عدد المجموعات التي تم تحميلهاعدد المجموعات التي يتم تحميلها حالياً في الذاكرة.sum(milvus_querycoord_collection_num{app_kubernetes_io_instance=~"$instance", app_kubernetes_io_name="$app_name", namespace="$namespace"}) by (app_kubernetes_io_instance)milvus_querycoord_collection_numعدد المجموعات التي يتم تحميلها حالياً بواسطة Milvus.
عدد الكيانات التي تم تحميلها حالياًعدد الكيانات التي يتم تحميلها حالياً في الذاكرة.sum(milvus_querycoord_entity_num{app_kubernetes_io_instance=~"$instance", app_kubernetes_io_name="$app_name", namespace="$namespace"}) by (app_kubernetes_io_instance)milvus_querycoord_entitiy_numعدد الكيانات التي يتم تحميلها حالياً بواسطة Milvus.
معدل طلبات التحميلعدد طلبات التحميل في الثانية خلال الدقيقتين الماضيتين.sum(increase(milvus_querycoord_load_req_count{app_kubernetes_io_instance=~"$instance", app_kubernetes_io_name="$app_name", namespace="$namespace"}[2m])120) by (status)milvus_querycoord_load_req_countالعدد المتراكم لطلبات التحميل.
معدل طلبات الإصدارعدد طلبات الإصدار لكل ثانية خلال الدقيقتين الماضيتين.sum(increase(milvus_querycoord_release_req_count{app_kubernetes_io_instance=~"$instance", app_kubernetes_io_name="$app_name", namespace="$namespace"}[2m])/120) by (status)milvus_querycoord_release_req_countعدد طلبات الإصدار المتراكمة.
زمن انتقال طلب التحميلمتوسط زمن الاستجابة والنسبة المئوية 99 من زمن استجابة طلبات التحميل خلال الدقيقتين الماضيتين.p99:
histogram_quantile(0.99, sum by (le) (rate(milvus_querycoord_load_latency_bucket{app_kubernetes_io_instance=~"$instance", app_kubernetes_io_name="$app_name", namespace="$namespace"}[2m])))
avg:
sum(increase(milvus_querycoord_load_latency_sum{app_kubernetes_io_instance=~"$instance", app_kubernetes_io_name="$app_name", namespace="$namespace"}[2m])) / sum(increase(milvus_querycoord_load_latency_count{app_kubernetes_io_instance=~"$instance", app_kubernetes_io_name="$app_name", namespace="$namespace"}[2m]))
milvus_querycoord_load_latencyالوقت المستخدم لإكمال طلب التحميل.
زمن انتقال طلب الإصدارمتوسط زمن الاستجابة والنسبة المئوية الـ 99 من زمن استجابة طلب الإصدار خلال الدقيقتين الماضيتين.p99:
histogram_quantile(0.99, sum by (le) (rate(milvus_querycoord_release_latency_bucket{app_kubernetes_io_instance=~"$instance", app_kubernetes_io_name="$app_name", namespace="$namespace"}[2m])))
avg:
sum(increase(milvus_querycoord_release_latency_sum{app_kubernetes_io_instance=~"$instance", app_kubernetes_io_name="$app_name", namespace="$namespace"}[2m])) / sum(increase(milvus_querycoord_release_latency_count{app_kubernetes_io_instance=~"$instance", app_kubernetes_io_name="$app_name", namespace="$namespace"}[2m]))
milvus_querycoord_release_latencyالوقت المستخدم لإكمال طلب الإصدار.
مهمة التحميل الفرعيعدد مهام التحميل الفرعي.sum(milvus_querycoord_child_task_num{app_kubernetes_io_instance=~"$instance", app_kubernetes_io_name="$app_name", namespace="$namespace"}) by (app_kubernetes_io_instance)milvus_querycoord_child_task_numعدد مهام التحميل الفرعية.
يقسم تنسيق الاستعلام طلب التحميل إلى مهام تحميل فرعية متعددة.
مهمة التحميل الأصليةعدد مهام التحميل الأصلية.sum(milvus_querycoord_parent_task_num{app_kubernetes_io_instance=~"$instance", app_kubernetes_io_name="$app_name", namespace="$namespace"}) by (app_kubernetes_io_instance)milvus_querycoord_parent_task_numعدد مهام التحميل الفرعية.
يتوافق كل طلب تحميل مع مهمة أصل في قائمة انتظار المهام.
زمن انتقال مهام التحميل الفرعيةمتوسط زمن الانتقال والنسبة المئوية 99 من زمن انتقال مهمة تحميل فرعية خلال الدقيقتين الماضيتين.p99:
histogram_quantile(0.99, sum by (le) (rate(milvus_querycoord_child_task_latency_bucket{app_kubernetes_io_instance=~"$instance", app_kubernetes_io_name="$app_name", namespace="$namespace"}[2m])))
avg:
sum(increase(milvus_querycoord_child_task_latency_sum{app_kubernetes_io_instance=~"$instance", app_kubernetes_io_name="$app_name", namespace="$namespace"}[2m])) / sum(increase(milvus_querycoord_child_task_latency_count{app_kubernetes_io_instance=~"$instance", app_kubernetes_io_name="$app_name", namespace="$namespace"}[2m])) namespace"}[2m])))
milvus_querycoord_child_task_latencyزمن الاستجابة لإكمال مهمة تحميل فرعي.
عدد عُقد الاستعلامعدد عقد الاستعلام التي يديرها منسق الاستعلام.sum(milvus_querycoord_querynode_num{app_kubernetes_io_instance=~"$instance", app_kubernetes_io_name="$app_name", namespace="$namespace"}) by (app_kubernetes_io_instance)milvus_querycoord_querynode_numعدد عقد الاستعلام التي يديرها منسق الاستعلام.

عقدة الاستعلام

لوحةوصف اللوحةPromQL (لغة استعلام Prometheus)مقاييس ميلفوس المستخدمةوصف مقاييس ميلفوس
عدد المجموعات التي تم تحميلهاعدد المجموعات التي تم تحميلها في الذاكرة بواسطة كل عقدة استعلام.sum(milvus_querynode_collection_num{app_kubernetes_io_instance=~"$instance", app_kubernetes_io_name="$app_name", namespace="$namespace"}) by (pod, node_id)milvus_querynode_collection_numعدد المجموعات التي تم تحميلها بواسطة كل عقدة استعلام.
عدد الأقسام المحملة في الذاكرةعدد الأقسام التي تم تحميلها في الذاكرة بواسطة كل عقدة استعلام.sum(milvus_querynode_partition_num{app_kubernetes_io_instance=~"$instance", app_kubernetes_io_name="$app_name", namespace="$namespace"}) by (pod, node_id)milvus_querynode_partition_numعدد الأقسام التي تم تحميلها بواسطة كل عقدة استعلام.
عدد الأجزاء المحملة في الذاكرةعدد المقاطع التي تم تحميلها في الذاكرة بواسطة كل عقدة استعلام.sum(milvus_querynode_segment_num{app_kubernetes_io_instance=~"$instance", app_kubernetes_io_name="$app_name", namespace="$namespace"}) by (pod, node_id)milvus_querynode_segment_numعدد المقاطع التي تم تحميلها بواسطة كل عقدة استعلام.
عدد الكيانات القابلة للاستعلام والبحثعدد الكيانات القابلة للاستعلام والبحث عنها في كل عقدة استعلام.sum(milvus_querynode_entity_num{app_kubernetes_io_instance=~"$instance", app_kubernetes_io_name="$app_name", namespace="$namespace"}) by (pod, node_id)milvus_querynode_entity_numعدد الكيانات القابلة للاستعلام والبحث عنها في كل عقدة استعلام.
قناة DML الافتراضيةعدد قنوات DML الافتراضية التي تتم مشاهدتها بواسطة كل عقدة استعلام.sum(milvus_querynode_dml_vchannel_num{app_kubernetes_io_instance=~"$instance", app_kubernetes_io_name="$app_name", namespace="$namespace"}) by (pod, node_id)milvus_querynode_dml_vchannel_numعدد قنوات DML الافتراضية التي تشاهدها كل عقدة استعلام.
قناة دلتا الافتراضيةعدد قنوات دلتا التي تشاهدها كل عقدة استعلام.sum(milvus_querynode_delta_vchannel_num{app_kubernetes_io_instance=~"$instance", app_kubernetes_io_name="$app_name", namespace="$namespace"}) by (pod, node_id)milvus_querynode_delta_vchannel_numعدد قنوات دلتا التي تشاهدها كل عقدة استعلام.
عدد المستهلكينعدد المستهلكين في كل عقدة استعلام.sum(milvus_querynode_consumer_num{app_kubernetes_io_instance=~"$instance", app_kubernetes_io_name="$app_name", namespace="$namespace"}) by (pod, node_id)milvus_querynode_consumer_numعدد المستهلكين في كل عقدة استعلام.
معدل طلبات البحثإجمالي عدد طلبات البحث والاستعلام التي تتلقاها كل عقدة استعلام في الثانية وعدد طلبات البحث والاستعلام الناجحة خلال الدقيقتين الماضيتين.sum(increase(milvus_querynode_sq_req_count{app_kubernetes_io_instance=~"$instance", app_kubernetes_io_name="$app_name", namespace="$namespace"}[2m])/120) by (query_type, status, pod, node_id)milvus_querynode_sq_req_countالعدد المتراكم لطلبات البحث والاستعلام.
زمن انتقال طلب البحثمتوسط زمن الاستجابة والنسبة المئوية الـ 99 للوقت المستخدم في طلبات البحث والاستعلام من قبل كل عقدة استعلام خلال الدقيقتين الماضيتين.
تعرض هذه اللوحة زمن انتقال طلبات البحث والاستعلام التي تكون حالتها "نجاح" أو "إجمالي".
p99:
histogram_quantile(0.99, sum by (le, pod, node_id) (rate(milvus_querynode_sq_req_latency_bucket{app_kubernetes_io_instance=~"$instance", app_kubernetes_io_name="$app_name", namespace="$namespace"}[2m])))
متوسط:
sum(increase(milvus_querynode_sq_req_latency_sum{app_kubernetes_io_instance=~"$instance", app_kubernetes_io_name="$app_name", namespace="$namespace"}[2m])) by(pod, node_id, query_type) / sum(increase(milvus_querynode_sq_req_latency_count{app_kubernetes_io_instance=~"$instance", app_kubernetes_io_name="$app_name", namespace="$namespace"}[2m])) by(pod, node_id, query_type)
milvus_querynode_sq_req_latencyزمن انتقال طلب البحث لعقدة الاستعلام.
زمن انتقال البحث في قائمة الانتظارمتوسط زمن الكمون والنسبة المئوية الـ 99 لزمن انتقال طلبات البحث والاستعلام في قائمة الانتظار خلال الدقيقتين الماضيتين.p99:
histogram_quantile(0.99, sum by (le, pod, node_id, query_type) (rate(milvus_querynode_sq_queue_latency_bucket{app_kubernetes_io_instance=~"$instance", app_kubernetes_io_name="$app_name", namespace="$namespace"}[2m])))
متوسط:
sum(increase(milvus_querynode_sq_queue_latency_sum{app_kubernetes_io_instance=~"$instance", app_kubernetes_io_name="$app_name", namespace="$namespace"}[2m])) by(pod, node_id, query_type) / sum(increase(milvus_querynode_sq_queue_latency_count{app_kubernetes_io_instance=~"$instance", app_kubernetes_io_name="$app_name", namespace="$namespace"}[2m])) by(pod, node_id, query_type)
milvus_querynode_sq_queue_latencyزمن انتقال طلبات البحث والاستعلام المستلمة بواسطة عقدة الاستعلام.
زمن انتقال جزء البحثمتوسط زمن الاستجابة والنسبة المئوية الـ 99 للوقت الذي تستغرقه كل عقدة استعلام للبحث والاستعلام عن مقطع خلال الدقيقتين الماضيتين.
يمكن أن تكون حالة المقطع مختومة أو متزايدة.
p99:
histogram_quantile(0.99, sum by (le, query_type, segment_state, pod, node_id) (rate(milvus_querynode_sq_segment_latency_bucket{app_kubernetes_io_instance=~"$instance", app_kubernetes_io_name="$app_name", namespace="$namespace"}[2m])))
avg:
sum(increase(milvus_querynode_sq_segment_latency_sum{app_kubernetes_io_instance=~"$instance", app_kubernetes_io_name="$app_name", namespace="$namespace"}[2m])) by(pod, node_id, query_type, segment_state) / sum(increase(milvus_querynode_sq_segment_latency_count{app_kubernetes_io_instance=~"$instance", app_kubernetes_io_name="$app_name", namespace="$namespace"}[2m])) by(pod, node_id, query_type, segment_state)
milvus_querynode_sq_segment_latencyالوقت الذي تستغرقه كل عقدة استعلام للبحث والاستعلام عن كل مقطع.
زمن انتقال طلب سيجكورمتوسط زمن الاستجابة والنسبة المئوية الـ 99 للوقت الذي تستغرقه كل عقدة استعلام للبحث والاستعلام في segcore خلال الدقيقتين الماضيتين.p99:
histogram_quantile(0.99, sum by (le, query_type, pod, node_id) (rate(milvus_querynode_sq_core_latency_bucket{app_kubernetes_io_instance=~"$instance", app_kubernetes_io_name="$app_name", namespace="$namespace"}[2m])))
متوسط:
sum(increase(milvus_querynode_sq_core_latency_sum{app_kubernetes_io_instance=~"$instance", app_kubernetes_io_name="$app_name", namespace="$namespace"}[2m])) by(pod, node_id, query_type) / sum(increase(milvus_querynode_sq_core_latency_count{app_kubernetes_io_instance=~"$instance", app_kubernetes_io_name="$app_name", namespace="$namespace"}[2m])) by(pod, node_id, query_type)
milvus_querynode_sq_core_latencyالوقت الذي تستغرقه كل عقدة استعلام للبحث والاستعلام في segcore.
زمن انتقال تقليل البحثمتوسط زمن الاستجابة والنسبة المئوية الـ 99 للوقت الذي تستغرقه كل عقدة استعلام خلال مرحلة تقليل البحث أو الاستعلام خلال الدقيقتين الماضيتين.p99:
histogram_quantile(0.99, sum by (le, pod, node_id, query_type) (rate(milvus_querynode_sq_reduce_latency_bucket{app_kubernetes_io_instance=~"$instance", app_kubernetes_io_name="$app_name", namespace="$namespace"}[2m])))
متوسط:
sum(increase(milvus_querynode_sq_reduce_latency_sum{app_kubernetes_io_instance=~"$instance", app_kubernetes_io_name="$app_name", namespace="$namespace"}[2m])) by(pod, node_id, query_type) / sum(increase(milvus_querynode_sq_reduce_latency_count{app_kubernetes_io_instance=~"$instance", app_kubernetes_io_name="$app_name", namespace="$namespace"}[2m])) by(pod, node_id, query_type)
milvus_querynode_sq_reduce_latencyالوقت الذي يقضيه كل استعلام خلال مرحلة الاختزال.
زمن انتقال جزء التحميلمتوسط زمن الاستجابة والنسبة المئوية الـ 99 للوقت الذي تستغرقه كل عقدة استعلام لتحميل مقطع خلال الدقيقتين الماضيتين.p99:
histogram_quantile(0.99, sum by (le, pod, node_id) (rate(milvus_querynode_load_segment_latency_bucket{app_kubernetes_io_instance=~"$instance", app_kubernetes_io_name="$app_name", namespace="$namespace"}[2m])))
متوسط:
sum(increase(milvus_querynode_load_segment_latency_sum{app_kubernetes_io_instance=~"$instance", app_kubernetes_io_name="$app_name", namespace="$namespace"}[2m])) by(pod, node_id) / sum(increase(milvus_querynode_load_segment_latency_count{app_kubernetes_io_instance=~"$instance", app_kubernetes_io_name="$app_name", namespace="$namespace"}[2m])) by(pod, node_id)
milvus_querynode_load_segment_latency_bucketالوقت الذي تستغرقه كل عقدة استعلام لتحميل مقطع.
عدد مخططات التدفقعدد مخططات التدفق في كل عقدة استعلام.sum(milvus_querynode_flowgraph_num{app_kubernetes_io_instance=~"$instance", app_kubernetes_io_name="$app_name", namespace="$namespace"}) by (pod, node_id)milvus_querynode_flowgraph_numعدد مخططات التدفق في كل عقدة استعلام.
طول مهمة القراءة غير المحلولةطول قائمة انتظار طلبات القراءة التي لم يتم حلها في كل عقدة استعلام.sum(milvus_querynode_read_task_unsolved_len{app_kubernetes_io_instance=~"$instance", app_kubernetes_io_name="$app_name", namespace="$namespace"}) by (pod, node_id)milvus_querynode_read_task_unsolved_lenطول قائمة انتظار طلبات القراءة التي لم يتم حلها.
طول مهمة القراءة الجاهزةطول قائمة انتظار طلبات القراءة التي سيتم تنفيذها في كل عقدة استعلام.sum(milvus_querynode_read_task_ready_len{app_kubernetes_io_instance=~"$instance", app_kubernetes_io_name="$app_name", namespace="$namespace"}) by (pod, node_id)milvus_querynode_read_task_ready_lenطول قائمة انتظار طلبات القراءة المطلوب تنفيذها.
عدد مهام القراءة المتوازيةعدد طلبات القراءة المتزامنة المنفذة حالياً في كل عقدة استعلام.sum(milvus_querynode_read_task_concurrency{app_kubernetes_io_instance=~"$instance", app_kubernetes_io_name="$app_name", namespace="$namespace"}) by (pod, node_id)milvus_querynode_read_task_concurrencyعدد طلبات القراءة المتزامنة المنفذة حالياً.
تقدير استخدام وحدة المعالجة المركزيةاستخدام وحدة المعالجة المركزية (CPU) من قبل كل عقدة استعلام مقدرة من قبل المجدول.sum(milvus_querynode_estimate_cpu_usage{app_kubernetes_io_instance=~"$instance", app_kubernetes_io_name="$app_name", namespace="$namespace"}) by (pod, node_id)milvus_querynode_estimate_cpu_usageاستخدام وحدة المعالجة المركزية من قبل كل عقدة استعلام مقدرة من قبل المجدول.
عندما تكون القيمة 100، فهذا يعني استخدام وحدة معالجة مركزية افتراضية كاملة (vCPU).
حجم مجموعة البحثمتوسط العدد والنسبة المئوية 99 لحجم مجموعة البحث (أي العدد الإجمالي لطلبات البحث الأصلية في طلبات البحث المجمعة التي تم تنفيذها بواسطة كل عقدة استعلام) خلال الدقيقتين الماضيتين.p99:
histogram_quantile(0.99, sum by (le, pod, node_id) (rate(milvus_querynode_search_group_size_bucket{app_kubernetes_io_instance=~"$instance", app_kubernetes_io_name="$app_name", namespace="$namespace"}[2m])))
متوسط:
sum(increase(milvus_querynode_search_group_size_sum{app_kubernetes_io_instance=~"$instance", app_kubernetes_io_name="$app_name", namespace="$namespace"}[2m])) by(pod, node_id) / sum(increase(milvus_querynode_search_group_size_count{app_kubernetes_io_instance=~"$instance", app_kubernetes_io_name="$app_name", namespace="$namespace"}[2m])) by(pod, node_id)
milvus_querynode_load_segment_latency_bucketعدد مهام البحث الأصلية من بين مهام البحث المجمعة من مجموعات مختلفة (أي حجم مجموعة البحث).
البحث NQمتوسط العدد والنسبة المئوية الـ 99 لعدد الاستعلامات (NQ) التي تم إجراؤها أثناء تنفيذ كل عقدة استعلام لطلبات البحث خلال الدقيقتين الماضيتين.p99:
histogram_quantile(0.99, sum by (le, pod, node_id) (rate(milvus_querynode_search_group_size_bucket{app_kubernetes_io_instance=~"$instance", app_kubernetes_io_name="$app_name", namespace="$namespace"}[2m])))
متوسط:
sum(increase(milvus_querynode_search_group_size_sum{app_kubernetes_io_instance=~"$instance", app_kubernetes_io_name="$app_name", namespace="$namespace"}[2m])) by(pod, node_id) / sum(increase(milvus_querynode_search_group_size_count{app_kubernetes_io_instance=~"$instance", app_kubernetes_io_name="$app_name", namespace="$namespace"}[2m])) by(pod, node_id)
milvus_querynode_querynode_seload_segment_latency_bucketعدد الاستعلامات (NQ) لطلبات البحث.
مجموعة البحث NQمتوسط العدد والنسبة المئوية الـ 99 لـ NQ لطلبات البحث مجتمعة والمنفذة بواسطة كل عقدة استعلام خلال الدقيقتين الماضيتين.p99:
histogram_quantile(0.99, sum by (le, pod, node_id) (rate(milvus_querynode_search_group_nq_bucket{app_kubernetes_io_instance=~"$instance", app_kubernetes_io_name="$app_name", namespace="$namespace"}[2m])))
متوسط:
sum(increase(milvus_querynode_search_group_nq_sum{app_kubernetes_io_instance=~"$instance", app_kubernetes_io_name="$app_name", namespace="$namespace"}[2m])) by(pod, node_id) / sum(increase(milvus_querynode_search_group_nq_count{app_kubernetes_io_instance=~"$instance", app_kubernetes_io_name="$app_name", namespace="$namespace"}[2m])) by(pod, node_id)
milvus_querynode_load_segment_latency_bucketNQ لطلبات البحث مجتمعة من مجموعات مختلفة.
البحث الأعلى_كمتوسط العدد والنسبة المئوية الـ 99 من Top_K لطلبات البحث المنفذة بواسطة كل عقدة استعلام خلال الدقيقتين الماضيتين.p99:
histogram_quantile(0.99, sum by (le, pod, node_id) (rate(milvus_querynode_search_topk_bucket{app_kubernetes_io_instance=~"$instance", app_kubernetes_io_name="$app_name", namespace="$namespace"}[2m])))
avg:
sum(increase(milvus_querynode_search_topk_sum{app_kubernetes_io_instance=~"$instance", app_kubernetes_io_name="$app_name", namespace="$namespace"}[2m])) by(pod, node_id) / sum(increase(milvus_querynode_search_topk_count{app_kubernetes_io_instance=~"$instance", app_kubernetes_io_name="$app_name", namespace="$namespace"}[2m])) by(pod, node_id)
milvus_querynode_load_segment_latency_bucketTop_K لطلبات البحث
مجموعة البحث Top_Kمتوسط العدد والنسبة المئوية الـ 99 من Top_K من طلبات البحث مجتمعة والمنفذة بواسطة كل عقدة استعلام خلال الدقيقتين الماضيتين.p99:
histogram_quantile(0.99, sum by (le, pod, node_id) (rate(milvus_querynode_search_group_topk_bucket{app_kubernetes_io_instance=~"$instance", app_kubernetes_io_name="$app_name", namespace="$namespace"}[2m])))
avg:
sum(increase(milvus_querynode_search_group_topk_sum{app_kubernetes_io_instance=~"$instance", app_kubernetes_io_name="$app_name", namespace="$namespace"}[2m])) by(pod, node_id) / sum(increase(milvus_querynode_search_group_topk_count{app_kubernetes_io_instance=~"$instance", app_kubernetes_io_name="$app_name", namespace="$namespace"}[2m])) by(pod, node_id)
milvus_querynode_load_segment_latency_bucketTop_K من طلبات البحث مجتمعة من مجموعات مختلفة .
معدل طلبات القراءة التي تم إخلاؤهاعدد طلبات القراءة التي تم إخلاؤها في الثانية الواحدة بواسطة كل عقدة استعلام خلال الدقيقتين الماضيتين.sum(increase(milvus_querynode_read_evicted_count{app_kubernetes_io_instance=~"$instance", app_kubernetes_io_name="$app_name", namespace="$namespace"}[2m])/120) by (pod, node_id)milvus_querynode_sq_req_countالعدد المتراكم لطلبات القراءة التي تم إخلاؤها بواسطة عقدة الاستعلام بسبب تقييد حركة المرور.

منسق البيانات

لوحةوصف اللوحةPromQL (لغة استعلام Prometheus)مقاييس ميلفوس المستخدمةوصف مقاييس ميلفوس
عدد عقد البياناتعدد عقد البيانات التي يديرها منسق البيانات.sum(milvus_datacoord_datanode_num{app_kubernetes_io_instance=~"$instance", app_kubernetes_io_name="$app_name", namespace="$namespace"}) by (app_kubernetes_io_instance)milvus_datacoord_datanode_numعدد عقد البيانات التي يديرها منسق البيانات.
عدد المقاطععدد جميع أنواع المقاطع المسجلة في البيانات الوصفية بواسطة منسق البيانات.sum(milvus_datacoord_segment_num{app_kubernetes_io_instance=~"$instance", app_kubernetes_io_name="$app_name", namespace="$namespace"}) by (segment_state)milvus_datacoord_segment_numعدد جميع أنواع المقاطع المسجلة في البيانات الوصفية بواسطة منسق البيانات.
تتضمن أنواع المقاطع ما يلي: تم إسقاطها، ومسحها، ومسحها، وتناميها، وإغلاقها.
عدد المجموعاتعدد المجموعات المسجلة في البيانات الوصفية حسب تنسيق البيانات.sum(milvus_datacoord_collection_num{app_kubernetes_io_instance=~"$instance", app_kubernetes_io_name="$app_name", namespace="$namespace"}) by (app_kubernetes_io_instance)milvus_datacoord_collection_numعدد المجموعات المسجلة في البيانات الوصفية حسب تنسيق البيانات.
الصفوف المخزنةالعدد المتراكم لصفوف البيانات الصالحة والمسحوبة في تنسيق البيانات.sum(milvus_datacoord_stored_rows_num{app_kubernetes_io_instance=~"$instance", app_kubernetes_io_name="$app_name", namespace="$namespace"}) by (app_kubernetes_io_instance)milvus_datacoord_stored_rows_numالعدد المتراكم لصفوف البيانات الصالحة والمسحوبة في تنسيق البيانات.
معدل الصفوف المخزنةمتوسط عدد الصفوف التي تم مسحها في الثانية خلال الدقيقتين الماضيتين.sum(increase(milvus_datacoord_stored_rows_count{app_kubernetes_io_instance=~"$instance", app_kubernetes_io_name="$app_name", namespace="$namespace"}[2m])/120) by (pod, node_id)milvus_datacoord_stored_rows_countالعدد المتراكم للصفوف التي تم مسحها بواسطة تنسيق البيانات.
وقت المزامنةمتوسط، والحد الأقصى، والحد الأدنى لعدد زمن الحقبة الزمنية التي تمت مزامنتها بواسطة تنسيق البيانات في كل قناة فعلية.avg(milvus_datacoord_sync_epoch_time{app_kubernetes_io_instance=~"$instance", app_kubernetes_io_name="$app_name", namespace="$namespace"}) by (app_kubernetes_io_instance) max(milvus_datacoord_sync_epoch_time{app_kubernetes_io_instance=~"$instance", app_kubernetes_io_name="$app_name", namespace="$namespace"}) by (app_kubernetes_io_instance) min(milvus_datacoord_sync_epoch_time{app_kubernetes_io_instance=~"$instance", app_kubernetes_io_name="$app_name", namespace="$namespace"}) by (app_kubernetes_io_instance)milvus_datacoord_sync_epoch_timeزمن الحقبة الزمنية لكل قناة فعلية (توقيت يونيكس، الميلي ثانية التي مرت منذ 1 يناير 1970).
حجم مدونة البيانات المخزنةالحجم الإجمالي لـ Binlog المخزنة.sum(milvus_datacoord_stored_binlog_size{app_kubernetes_io_instance=~"$instance", app_kubernetes_io_name="$app_name", namespace="$namespace"}) by (app_kubernetes_io_instance)milvus_datacoord_stored_binlog_sizeالحجم الكلي لـ Binlog المخزنة في ميلفوس.

عقدة البيانات

لوحةوصف اللوحةPromQL (لغة استعلام Prometheus)مقاييس ملفوس المستخدمةوصف مقاييس ميلفوس
رقم مخطط التدفقعدد كائنات مخطط التدفق التي تتوافق مع كل عقدة بيانات.sum(milvus_datanode_flowgraph_num{app_kubernetes_io_instance=~"$instance", app_kubernetes_io_name="$app_name", namespace="$namespace"}) by (pod, node_id)milvus_datanode_flowgraph_numعدد كائنات مخطط التدفق.
كل جزء في المجموعة يتوافق مع كائن مخطط انسيابي.
معدل استهلاك صفوف الرسائلعدد صفوف رسائل التدفق المستهلكة لكل ثانية بواسطة كل عقدة بيانات خلال الدقيقتين الماضيتين.sum(increase(milvus_datanode_msg_rows_count{app_kubernetes_io_instance=~"$instance", app_kubernetes_io_name="$app_name", namespace="$namespace"}[2m])/120) by (msg_type, pod, node_id)milvus_datanode_msg_rows_countعدد صفوف رسائل التدفق المستهلكة.
حالياً، رسائل التدفق التي يتم حسابها بواسطة عقدة البيانات تتضمن فقط رسائل الإدراج والحذف.
معدل حجم البيانات المتدفقةحجم كل رسالة متدفقة يتم تسجيلها في الثانية من قبل كل عقدة بيانات خلال الدقيقتين الماضيتين.sum(increase(milvus_datanode_flushed_data_size{app_kubernetes_io_instance=~"$instance", app_kubernetes_io_name="$app_name", namespace="$namespace"}[2m])/120) by (msg_type, pod, node_id)milvus_datanode_flushed_data_sizeحجم كل رسالة متدفقة.
في الوقت الحالي، تتضمن رسائل التدفق المحسوبة بواسطة عقدة البيانات رسائل الإدراج والحذف فقط.
عدد المستهلكينعدد المستهلكين الذين تم إنشاؤهم على كل عقدة بيانات.sum(milvus_datanode_consumer_num{app_kubernetes_io_instance=~"$instance", app_kubernetes_io_name="$app_name", namespace="$namespace"}) by (pod, node_id)milvus_datanode_consumer_numعدد المستهلكين الذين تم إنشاؤهم على كل عقدة بيانات.
يتوافق كل مخطط تدفق مع مستهلك.
عدد المنتجينعدد المنتجين الذين تم إنشاؤهم على كل عقدة بيانات.sum(milvus_datanode_producer_num{app_kubernetes_io_instance=~"$instance", app_kubernetes_io_name="$app_name", namespace="$namespace"}) by (pod, node_id)milvus_datanode_producer_numعدد المستهلكين الذين تم إنشاؤهم على كل عقدة بيانات.
كل جزء في المجموعة يتوافق مع منتج قناة دلتا ومنتج قناة زمنية.
وقت المزامنةالعدد المتوسط والحد الأقصى والأدنى لوقت الحقبة الزمنية التي تمت مزامنتها من قبل كل عقدة بيانات في جميع المواضيع الفعلية.avg(milvus_datanode_sync_epoch_time{app_kubernetes_io_instance=~"$instance", app_kubernetes_io_name="$app_name", namespace="$namespace"}) by (pod, node_id) max(milvus_datanode_sync_epoch_time{app_kubernetes_io_instance=~"$instance", app_kubernetes_io_name="$app_name", namespace="$namespace"}) by (pod, node_id) min(milvus_datanode_sync_epoch_time{app_kubernetes_io_instance=~"$instance", app_kubernetes_io_name="$app_name", namespace="$namespace"}) by (pod, node_id)milvus_datanode_sync_epoch_timeوقت الحقبة الزمنية (وقت يونيكس، أي الميلي ثانية التي مرت منذ 1 يناير 1970.) لكل موضوع فعلي في عقدة البيانات.
عدد المقاطع غير الممسوحةعدد المقاطع غير الممسوحة التي لم يتم مسحها على كل عقدة بيانات.sum(milvus_datanode_unflushed_segment_num{app_kubernetes_io_instance=~"$instance", app_kubernetes_io_name="$app_name", namespace="$namespace"}) by (pod, node_id)milvus_datanode_unflushed_segment_numعدد المقاطع غير الممسوحة التي لم يتم مسحها على كل عقدة بيانات.
زمن انتقال المخزن المؤقت للتشفيرمتوسط زمن الاستجابة والنسبة المئوية ال 99 للوقت المستخدم لتشفير المخزن المؤقت بواسطة كل عقدة بيانات خلال الدقيقتين الماضيتين.p99:
histogram_quantile(0.99, sum by (le, pod, node_id) (rate(milvus_datanode_encode_buffer_latency_bucket{app_kubernetes_io_instance=~"$instance", app_kubernetes_io_name="$app_name", namespace="$namespace"}[2m])))
متوسط:
sum(increase(milvus_datanode_encode_buffer_latency_sum{app_kubernetes_io_instance=~"$instance", app_kubernetes_io_name="$app_name", namespace="$namespace"}[2m])) by(pod, node_id) / sum(increase(milvus_datanode_encode_buffer_latency_count{app_kubernetes_io_instance=~"$instance", app_kubernetes_io_name="$app_name", namespace="$namespace"}[2m])) by(pod, node_id)
milvus_datanode_encode_buffer_latencyالوقت الذي تستغرقه كل عقدة بيانات لتشفير مخزن مؤقت.
حفظ كمون البياناتمتوسط زمن الاستجابة والنسبة المئوية الـ 99 للوقت المستخدم لكتابة مخزن مؤقت في طبقة التخزين بواسطة كل عقدة بيانات خلال الدقيقتين الماضيتين.p99:
histogram_quantile(0.99, sum by (le, pod, node_id) (rate(milvus_datanode_save_latency_bucket{app_kubernetes_io_instance=~"$instance", app_kubernetes_io_name="$app_name", namespace="$namespace"}[2m])))
متوسط:
sum(increase(milvus_datanode_save_latency_sum{app_kubernetes_io_instance=~"$instance", app_kubernetes_io_name="$app_name", namespace="$namespace"}[2m])) by(pod, node_id) / sum(increase(milvus_datanode_save_latency_count{app_kubernetes_io_instance=~"$instance", app_kubernetes_io_name="$app_name", namespace="$namespace"}[2m])) by(pod, node_id)
milvus_datanode_save_latencyالوقت الذي تستغرقه كل عقدة بيانات لكتابة مخزن مؤقت في طبقة التخزين.
معدل تشغيل التدفقعدد المرات التي تقوم فيها كل عقدة بيانات بمسح مخزن مؤقت في الثانية خلال الدقيقتين الماضيتين.sum(increase(milvus_datanode_flush_buffer_op_count{app_kubernetes_io_instance=~"$instance", app_kubernetes_io_name="$app_name", namespace="$namespace"}[2m])/120) by (status, pod, node_id)milvus_datanode_flush_buffer_op_countعدد المرات المتراكمة التي تقوم فيها عقدة البيانات بمسح مخزن مؤقت.
معدل تشغيل التدفق التلقائيعدد المرات التي تقوم فيها كل عقدة بيانات بمسح المخزن المؤقت تلقائياً لكل ثانية خلال الدقيقتين الماضيتين.sum(increase(milvus_datanode_autoflush_buffer_op_count{app_kubernetes_io_instance=~"$instance", app_kubernetes_io_name="$app_name", namespace="$namespace"}[2m])/120) by (status, pod, node_id)milvus_datanode_autoflush_buffer_op_countعدد المرات المتراكمة التي تقوم فيها عقدة بيانات بمسح المخزن المؤقت تلقائياً.
معدل طلب التنظيفعدد المرات التي تتلقى فيها كل عقدة بيانات طلب مسح المخزن المؤقت لكل ثانية خلال الدقيقتين الماضيتين.sum(increase(milvus_datanode_flush_req_count{app_kubernetes_io_instance=~"$instance", app_kubernetes_io_name="$app_name", namespace="$namespace"}[2m])/120) by (status, pod, node_id)milvus_datanode_flush_req_countالعدد المتراكم للمرات التي تتلقى فيها عقدة بيانات طلب مسح من منسق بيانات.
زمن انتقال الضغطمتوسط زمن الاستجابة و99 النسبة المئوية للوقت الذي تستغرقه كل عقدة بيانات لتنفيذ مهمة ضغط خلال الدقيقتين الماضيتين.p99:
histogram_quantile(0.99, sum by (le, pod, node_id) (rate(milvus_datanode_compaction_latency_bucket{app_kubernetes_io_instance=~"$instance", app_kubernetes_io_name="$app_name", namespace="$namespace"}[2m])))
متوسط:
sum(increase(milvus_datanode_compaction_latency_sum{app_kubernetes_io_instance=~"$instance", app_kubernetes_io_name="$app_name", namespace="$namespace"}[2m])) by(pod, node_id) / sum(increase(milvus_datanode_compaction_latency_count{app_kubernetes_io_instance=~"$instance", app_kubernetes_io_name="$app_name", namespace="$namespace"}[2m])) by(pod, node_id)
milvus_datanode_compaction_latencyالوقت الذي تستغرقه كل عقدة بيانات لتنفيذ مهمة ضغط.

منسق الفهرس

لوحةوصف اللوحةPromQL (لغة استعلام Prometheus)مقاييس ميلفوس المستخدمةوصف مقاييس ميلفوس
معدل طلبات الفهرسمتوسط عدد طلبات بناء الفهرس المستلمة في الثانية خلال الدقيقتين الماضيتين.sum(increase(milvus_indexcoord_indexreq_count{app_kubernetes_io_instance=~"$instance", app_kubernetes_io_name="$app_name", namespace="$namespace"}[2m])/120) by (status)milvus_indexcoord_indexreq_countعدد طلبات بناء الفهرس المستلمة.
عدد مهام الفهرسعدد جميع مهام الفهرسة المسجلة في البيانات الوصفية للفهرس.sum(milvus_indexcoord_indextask_count{app_kubernetes_io_instance=~"$instance", app_kubernetes_io_name="$app_name", namespace="$namespace"}) by (index_task_status)milvus_indexcoord_indextask_countعدد كافة مهام الفهرسة المسجلة في البيانات الوصفية للفهرس.
عدد عقد الفهرسعدد عقد الفهرس المدارة.sum(milvus_indexcoord_indexnode_num{app_kubernetes_io_instance=~"$instance", app_kubernetes_io_name="$app_name", namespace="$namespace"}) by (app_kubernetes_io_instance)milvus_indexcoord_indexnode_numعدد عقد الفهرس المدارة.

عقدة الفهرس

لوحةوصف اللوحةPromQL (لغة استعلام Prometheus)مقاييس ميلفوس المستخدمةوصف مقاييس ميلفوس
معدل مهام الفهرسمتوسط عدد مهام بناء الفهرس المستلمة من قبل كل عقدة فهرس في الثانية خلال الدقيقتين الماضيتين.sum(increase(milvus_indexnode_index_task_count{app_kubernetes_io_instance=~"$instance", app_kubernetes_io_name="$app_name", namespace="$namespace"}[2m])/120) by (status, pod, node_id)milvus_indexnode_index_task_countعدد مهام بناء الفهرس المستلمة.
زمن انتقال حقل التحميلمتوسط زمن الوصول والنسبة المئوية الـ 99 للوقت الذي تستغرقه كل عقدة فهرس لتحميل بيانات حقل المقطع في كل مرة خلال الدقيقتين الماضيتين.p99:
histogram_quantile(0.99, sum by (le, pod, node_id) (rate(milvus_indexnode_load_field_latency_bucket{app_kubernetes_io_instance=~"$instance", app_kubernetes_io_name="$app_name", namespace="$namespace"}[2m])))
متوسط:
sum(increase(milvus_indexnode_load_field_latency_sum{app_kubernetes_io_instance=~"$instance", app_kubernetes_io_name="$app_name", namespace="$namespace"}[2m])) by(pod, node_id) / sum(increase(milvus_indexnode_load_field_latency_count{app_kubernetes_io_instance=~"$instance", app_kubernetes_io_name="$app_name", namespace="$namespace"}[2m])) by(pod, node_id)
milvus_indexnode_load_field_latencyالوقت الذي تستخدمه عقدة الفهرس لتحميل بيانات حقل المقطع.
زمن انتقال حقل فك التشفيرمتوسط زمن الاستجابة والنسبة المئوية الـ 99 للوقت الذي تستخدمه كل عقدة فهرس لتشفير بيانات الحقل في كل مرة خلال الدقيقتين الماضيتين.p99:
histogram_quantile(0.99, sum by (le, pod, node_id) (rate(milvus_indexnode_decode_field_latency_bucket{app_kubernetes_io_instance=~"$instance", app_kubernetes_io_name="$app_name", namespace="$namespace"}[2m])))
متوسط:
sum(increase(milvus_indexnode_decode_field_latency_sum{app_kubernetes_io_instance=~"$instance", app_kubernetes_io_name="$app_name", namespace="$namespace"}[2m])) by(pod, node_id) / sum(increase(milvus_indexnode_decode_field_latency_count{app_kubernetes_io_instance=~"$instance", app_kubernetes_io_name="$app_name", namespace="$namespace"}[2m])) by(pod, node_id)
milvus_indexnode_decode_field_latencyالوقت المستخدم لفك تشفير بيانات الحقل.
كمون بناء الفهرسمتوسط زمن الاستجابة والنسبة المئوية 99 للوقت الذي استخدمته كل عقدة فهرس لبناء الفهارس خلال الدقيقتين الماضيتين.p99:
histogram_quantile(0.99, sum by (le, pod, node_id) (rate(milvus_indexnode_build_index_latency_bucket{app_kubernetes_io_instance=~"$instance", app_kubernetes_io_name="$app_name", namespace="$namespace"}[2m])))
متوسط:
sum(increase(milvus_indexnode_build_index_latency_sum{app_kubernetes_io_instance=~"$instance", app_kubernetes_io_name="$app_name", namespace="$namespace"}[2m])) by(pod, node_id) / sum(increase(milvus_indexnode_build_index_latency_count{app_kubernetes_io_instance=~"$instance", app_kubernetes_io_name="$app_name", namespace="$namespace"}[2m])) by(pod, node_id)
milvus_indexnode_build_index_latencyالوقت المستخدم لبناء الفهارس.
زمن انتقال فهرس التشفيرمتوسط زمن الاستجابة والنسبة المئوية 99 للوقت الذي استخدمته كل عقدة فهرس لتشفير ملفات الفهرس خلال الدقيقتين الماضيتين.p99:
histogram_quantile(0.99, sum by (le, pod, node_id) (rate(milvus_indexnode_encode_index_latency_bucket{app_kubernetes_io_instance=~"$instance", app_kubernetes_io_name="$app_name", namespace="$namespace"}[2m])))
متوسط:
sum(increase(milvus_indexnode_encode_index_latency_sum{app_kubernetes_io_instance=~"$instance", app_kubernetes_io_name="$app_name", namespace="$namespace"}[2m])) by(pod, node_id) / sum(increase(milvus_indexnode_encode_index_latency_count{app_kubernetes_io_instance=~"$instance", app_kubernetes_io_name="$app_name", namespace="$namespace"}[2m])) by(pod, node_id)
milvus_indexnode_encode_index_latencyالوقت المستخدم لتشفير ملفات الفهرس.
حفظ كمون الفهرسمتوسط زمن الاستجابة والنسبة المئوية 99 للوقت المستخدم من قبل كل عقدة فهرس لحفظ ملفات الفهرس خلال الدقيقتين الماضيتين.p99:
histogram_quantile(0.99, sum by (le, pod, node_id) (rate(milvus_indexnode_save_index_latency_bucket{app_kubernetes_io_instance=~"$instance", app_kubernetes_io_name="$app_name", namespace="$namespace"}[2m])))
متوسط الوقت:
sum(increase(milvus_indexnode_save_index_latency_sum{app_kubernetes_io_instance=~"$instance", app_kubernetes_io_name="$app_name", namespace="$namespace"}[2m])) by(pod, node_id) / sum(increase(milvus_indexnode_save_index_latency_count{app_kubernetes_io_instance=~"$instance", app_kubernetes_io_name="$app_name", namespace="$namespace"}[2m])) by(pod, node_id)
milvus_indexnode_save_index_latencyالوقت المستخدم لحفظ ملفات الفهرس.

جرب Managed Milvus مجاناً

Zilliz Cloud خالي من المتاعب، ويعمل بواسطة Milvus ويعمل بسرعة 10 أضعاف.

ابدأ
التعليقات

هل كانت هذه الصفحة مفيدة؟