🚀 Попробуйте Zilliz Cloud, полностью управляемый Milvus, бесплатно — ощутите 10-кратное увеличение производительности! Попробовать сейчас>

milvus-logo
LFAI
Главная
  • Руководство по администрированию
  • Home
  • Docs
  • Руководство по администрированию

  • Мониторинг, оповещения и журналы

  • Мониторинг

  • Приборная панель показателей Milvus

Приборная панель метрик Milvus

Во время работы Milvus выводит список подробных метрик с временными рядами. Для визуализации метрик можно использовать Prometheus и Grafana. В этой теме представлены метрики мониторинга, отображаемые в Grafana Milvus Dashboard.

Единицей времени в этой теме являются миллисекунды. А "99-й процентиль" в этой теме означает, что 99 процентов времени статистика контролируется в пределах определенного значения.

Для понимания метрик Prometheus мы рекомендуем сначала прочитать обзор фреймворка мониторинга Milvus.

Прокси

ПанельОписание панелиPromQL (язык запросов Prometheus)Используемые метрики MilvusОписание метрик Milvus
Скорость подсчета поисковых векторовСреднее количество векторов, запрашиваемых в секунду каждым прокси в течение последних двух минут.sum(increase(milvus_proxy_search_vectors_count{app_kubernetes_io_instance=~"$instance", app_kubernetes_io_name="$app_name", namespace="$namespace"}[2m])/120) by (pod, node_id)milvus_proxy_search_vectors_countНакопленное количество запрошенных векторов.
Insert Vector Count RateСреднее количество векторов, вставленных в секунду каждым прокси в течение последних двух минут.sum(increase(milvus_proxy_insert_vectors_count{app_kubernetes_io_instance=~"$instance", app_kubernetes_io_name="$app_name", namespace="$namespace"}[2m])/120) by (pod, node_id)milvus_proxy_insert_vectors_countНакопленное количество вставленных векторов.
Латентность поискаСредняя задержка и 99-й процентиль задержки получения запросов на поиск и запрос каждым прокси в течение последних двух минут.p99:
histogram_quantile(0.99, sum by (le, query_type, pod, node_id) (rate(milvus_proxy_sq_latency_bucket{app_kubernetes_io_instance=~"$instance", app_kubernetes_io_name="$app_name", namespace="$namespace"}[2m])))
avg:
sum(increase(milvus_proxy_sq_latency_sum{app_kubernetes_io_instance=~"$instance", app_kubernetes_io_name="$app_name", namespace="$namespace"}[2m])) by (pod, node_id, query_type) / sum(increase(milvus_proxy_sq_latency_count{app_kubernetes_io_instance=~"$instance", app_kubernetes_io_name="$app_name", namespace="$namespace"}[2m])) by (pod, node_id, query_type)
milvus_proxy_sq_latencyЗадержка запросов на поиск и запросы.
Задержка поиска коллекцииСредняя задержка и 99-й процентиль задержки получения запросов поиска и запросов к определенной коллекции каждым прокси в течение последних двух минут.p99:
histogram_quantile(0.99, sum by (le, query_type, pod, node_id) (rate(milvus_proxy_collection_sq_latency_bucket{app_kubernetes_io_instance=~"$instance", app_kubernetes_io_name="$app_name", namespace="$namespace", collection_name=~"$collection"}[2m])))
avg:
sum(increase(milvus_proxy_collection_sq_latency_sum{app_kubernetes_io_instance=~"$instance", app_kubernetes_io_name="$app_name", namespace="$namespace", collection_name=~"$collection"}[2m])) by (pod, node_id, query_type) / sum(increase(milvus_proxy_collection_sq_latency_count{app_kubernetes_io_instance=~"$instance", app_kubernetes_io_name="$app_name", namespace="$namespace", collection_name=~"$collection"}[2m])) by (pod, node_id, query_type)
milvus_proxy_collection_sq_latency_sumВремя ожидания запросов поиска и запросов к определенной коллекции
Мутационная задержкаСредняя задержка и 99-й процентиль задержки получения запросов на мутацию каждым прокси в течение последних двух минут.p99:
histogram_quantile(0.99, sum by (le, msg_type, pod, node_id) (rate(milvus_proxy_mutation_latency_bucket{app_kubernetes_io_instance=~"$instance", app_kubernetes_io_name="$app_name", namespace="$namespace"}[2m])))
avg:
sum(increase(milvus_proxy_mutation_latency_sum{app_kubernetes_io_instance=~"$instance", app_kubernetes_io_name="$app_name", namespace="$namespace"}[2m])) by (pod, node_id, msg_type) / sum(increase(milvus_proxy_mutation_latency_count{app_kubernetes_io_instance=~"$instance", app_kubernetes_io_name="$app_name", namespace="$namespace"}[2m])) by (pod, node_id, msg_type)
milvus_proxy_mutation_latency_sumЗадержка запросов на мутацию.
Латентность мутации коллекцииСредняя задержка и 99-й процентиль задержки получения запросов мутации к определенной коллекции каждым прокси в течение последних двух минут.p99:
histogram_quantile(0.99, sum by (le, query_type, pod, node_id) (rate(milvus_proxy_collection_sq_latency_bucket{app_kubernetes_io_instance=~"$instance", app_kubernetes_io_name="$app_name", namespace="$namespace", collection_name=~"$collection"}[2m])))
avg:
sum(increase(milvus_proxy_collection_sq_latency_sum{app_kubernetes_io_instance=~"$instance", app_kubernetes_io_name="$app_name", namespace="$namespace", collection_name=~"$collection"}[2m])) by (pod, node_id, query_type) / sum(increase(milvus_proxy_collection_sq_latency_count{app_kubernetes_io_instance=~"$instance", app_kubernetes_io_name="$app_name", namespace="$namespace", collection_name=~"$collection"}[2m])) by (pod, node_id, query_type)
milvus_proxy_collection_sq_latency_sumЗадержка запросов мутации к определенной коллекции
Задержка ожидания результатов поискаСредняя задержка и 99-й процентиль задержки между отправкой запросов поиска и запросов и получением результатов прокси в течение последних двух минут.p99:
histogram_quantile(0.99, sum by (le, query_type, pod, node_id) (rate(milvus_proxy_sq_wait_result_latency_bucket{app_kubernetes_io_instance=~"$instance", app_kubernetes_io_name="$app_name", namespace="$namespace"}[2m])))
avg:
sum(increase(milvus_proxy_sq_wait_result_latency_sum{app_kubernetes_io_instance=~"$instance", app_kubernetes_io_name="$app_name", namespace="$namespace"}[2m])) by (pod, node_id, query_type) / sum(increase(milvus_proxy_sq_wait_result_latency_count{app_kubernetes_io_instance=~"$instance", app_kubernetes_io_name="$app_name", namespace="$namespace"}[2m])) by (pod, node_id, query_type)
milvus_proxy_sq_wait_result_latencyЗадержка между отправкой запросов на поиск и получение результатов.
Уменьшить задержку результатов поискаСредняя задержка и 99-й процентиль задержки агрегирования результатов поиска и запросов через прокси в течение последних двух минут.p99:
histogram_quantile(0.99, sum by (le, query_type, pod, node_id) (rate(milvus_proxy_sq_reduce_result_latency_bucket{app_kubernetes_io_instance=~"$instance", app_kubernetes_io_name="$app_name", namespace="$namespace"}[2m])))
avg:
sum(increase(milvus_proxy_sq_reduce_result_latency_sum{app_kubernetes_io_instance=~"$instance", app_kubernetes_io_name="$app_name", namespace="$namespace"}[2m])) by (pod, node_id, query_type) / sum(increase(milvus_proxy_sq_reduce_result_latency_count{app_kubernetes_io_instance=~"$instance", app_kubernetes_io_name="$app_name", namespace="$namespace"}[2m])) by (pod, node_id, query_type)
milvus_proxy_sq_reduce_result_latencyЗадержка объединения результатов поиска и запросов, возвращаемых каждым узлом запроса.
Задержка декодирования результатов поискаСредняя задержка и 99-й процентиль задержки декодирования результатов поиска и запросов по прокси в течение последних двух минут.p99:
histogram_quantile(0.99, sum by (le, query_type, pod, node_id) (rate(milvus_proxy_sq_decode_result_latency_bucket{app_kubernetes_io_instance=~"$instance", app_kubernetes_io_name="$app_name", namespace="$namespace"}[2m])))
avg:
sum(increase(milvus_proxy_sq_decode_result_latency_sum{app_kubernetes_io_instance=~"$instance", app_kubernetes_io_name="$app_name", namespace="$namespace"}[2m])) by (pod, node_id, query_type) / sum(increase(milvus_proxy_sq_decode_resultlatency_count{app_kubernetes_io_instance=~"$instance", app_kubernetes_io_name="$app_name", namespace="$namespace"}[2m])) by (pod, node_id, query_type)
milvus_proxy_sq_decode_result_latencyЗадержка декодирования каждого результата поиска и запроса.
Msg Stream Object NumСреднее, максимальное и минимальное количество объектов msgstream, созданных каждым прокси на соответствующей физической теме за последние две минуты.avg(milvus_proxy_msgstream_obj_num{app_kubernetes_io_instance=~"$instance", app_kubernetes_io_name="$app_name", namespace="$namespace"}) by (pod, node_id) max(milvus_proxy_msgstream_obj_num{app_kubernetes_io_instance=~"$instance", app_kubernetes_io_name="$app_name", namespace="$namespace"}) by (pod, node_id) min(milvus_proxy_msgstream_obj_num{app_kubernetes_io_instance=~"$instance", app_kubernetes_io_name="$app_name", namespace="$namespace"}) by (pod, node_id)milvus_proxy_msgstream_obj_numКоличество объектов msgstream, созданных в каждой физической теме.
Задержка отправки мутацийСредняя задержка и 99-й процентиль задержки отправки запросов на вставку или удаление каждым прокси в течение последних двух минут.p99:
histogram_quantile(0.99, sum by (le, msg_type, pod, node_id) (rate(milvus_proxy_mutation_send_latency_bucket{app_kubernetes_io_instance=~"$instance", app_kubernetes_io_name="$app_name", namespace="$namespace"}[2m])))
avg:
sum(increase(milvus_proxy_mutation_send_latency_sum{app_kubernetes_io_instance=~"$instance", app_kubernetes_io_name="$app_name", namespace="$namespace"}[2m])) by (pod, node_id, msg_type) / sum(increase(milvus_proxy_mutation_send_latency_count{app_kubernetes_io_instance=~"$instance", app_kubernetes_io_name="$app_name", namespace="$namespace"}[2m])) by (pod, node_id, msg_type)
milvus_proxy_mutation_send_latencyЗадержка отправки запросов на вставку или удаление.
Скорость попадания в кэшСредний показатель попадания в кэш операций, включая GeCollectionID, GetCollectionInfo и GetCollectionSchema в секунду в течение последних двух минут.sum(increase(milvus_proxy_cache_hit_count{app_kubernetes_io_instance=~"$instance", app_kubernetes_io_name="$app_name", namespace="$namespace", cache_state="hit"}[2m])/120) by(cache_name, pod, node_id) / sum(increase(milvus_proxy_cache_hit_count{app_kubernetes_io_instance=~"$instance", app_kubernetes_io_name="$app_name", namespace="$namespace"}[2m])/120) by(cache_name, pod, node_id)milvus_proxy_cache_hit_countСтатистика попаданий и отказов для каждой операции чтения кэша.
Задержка обновления кэшаСредняя задержка и 99-й процентиль задержки обновления кэша по прокси в течение последних двух минут.p99:
histogram_quantile(0.99, sum by (le, pod, node_id) (rate(milvus_proxy_cache_update_latency_bucket{app_kubernetes_io_instance=~"$instance", app_kubernetes_io_name="$app_name", namespace="$namespace"}[2m])))
avg:
sum(increase(milvus_proxy_cache_update_latency_sum{app_kubernetes_io_instance=~"$instance", app_kubernetes_io_name="$app_name", namespace="$namespace"}[2m])) by (pod, node_id) / sum(increase(milvus_proxy_cache_update_latency_count{app_kubernetes_io_instance=~"$instance", app_kubernetes_io_name="$app_name", namespace="$namespace"}[2m])) by (pod, node_id)
milvus_proxy_cache_update_latencyЗадержка обновления кэша каждый раз.
Время синхронизацииСреднее, максимальное и минимальное количество эпохального времени, синхронизированного каждым прокси в соответствующем физическом канале.avg(milvus_proxy_sync_epoch_time{app_kubernetes_io_instance=~"$instance", app_kubernetes_io_name="$app_name", namespace="$namespace"}) by (pod, node_id) max(milvus_proxy_sync_epoch_time{app_kubernetes_io_instance=~"$instance", app_kubernetes_io_name="$app_name", namespace="$namespace"}) by (pod, node_id) min(milvus_proxy_sync_epoch_time{app_kubernetes_io_instance=~"$instance", app_kubernetes_io_name="$app_name", namespace="$namespace"}) by (pod, node_id)milvus_proxy_sync_epoch_timeВремя эпохи каждого физического канала (время Unix, миллисекунды, прошедшие с 1 января 1970 года).
По умолчанию существует ChannelName, не относящийся к физическим каналам.
Применить задержку PKСредняя задержка и 99-й процентиль задержки применения первичного ключа каждым прокси за последние две минуты.p99:
histogram_quantile(0.99, sum by (le, pod, node_id) (rate(milvus_proxy_apply_pk_latency_bucket{app_kubernetes_io_instance=~"$instance", app_kubernetes_io_name="$app_name", namespace="$namespace"}[2m])))
avg:
sum(increase(milvus_proxy_apply_pk_latency_sum{app_kubernetes_io_instance=~"$instance", app_kubernetes_io_name="$app_name", namespace="$namespace"}[2m])) by (pod, node_id) / sum(increase(milvus_proxy_apply_pk_latency_count{app_kubernetes_io_instance=~"$instance", app_kubernetes_io_name="$app_name", namespace="$namespace"}[2m])) by (pod, node_id)
milvus_proxy_apply_pk_latencyЗадержка применения первичного ключа.
Задержка применения временной меткиСредняя задержка и 99-й процентиль задержки применения временной метки каждым прокси в течение последних двух минут.p99:
histogram_quantile(0.99, sum by (le, pod, node_id) (rate(milvus_proxy_apply_timestamp_latency_bucket{app_kubernetes_io_instance=~"$instance", app_kubernetes_io_name="$app_name", namespace="$namespace"}[2m])))
avg:
sum(increase(milvus_proxy_apply_timestamp_latency_sum{app_kubernetes_io_instance=~"$instance", app_kubernetes_io_name="$app_name", namespace="$namespace"}[2m])) by (pod, node_id) / sum(increase(milvus_proxy_apply_timestamp_latency_count{app_kubernetes_io_instance=~"$instance", app_kubernetes_io_name="$app_name", namespace="$namespace"}[2m])) by (pod, node_id)
milvus_proxy_apply_timestamp_latencyЗадержка применения временной метки.
Коэффициент успешности запросовКоличество успешных запросов, полученных в секунду каждым прокси, с подробной разбивкой по типам запросов. Возможные типы запросов: DescribeCollection, DescribeIndex, GetCollectionStatistics, HasCollection, Search, Query, ShowPartitions, Insert и т. д.
sum(increase(milvus_proxy_req_count{app_kubernetes_io_instance=~"$instance", app_kubernetes_io_name="$app_name", namespace="$namespace", status="success"}[2m])/120) by(function_name, pod, node_id)milvus_proxy_req_countКоличество всех типов полученных запросов
Частота неудачных запросовКоличество неудачных запросов, полученных в секунду каждым прокси, с подробной разбивкой по каждому типу запросов. Возможные типы запросов: DescribeCollection, DescribeIndex, GetCollectionStatistics, HasCollection, Search, Query, ShowPartitions, Insert и т. д.
sum(increase(milvus_proxy_req_count{app_kubernetes_io_instance=~"$instance", app_kubernetes_io_name="$app_name", namespace="$namespace", status="fail"}[2m])/120) by(function_name, pod, node_id)milvus_proxy_req_countКоличество всех типов полученных запросов
Латентность запросаСредняя задержка и 99-й процентиль задержки всех типов принимаемых запросов каждым прокси-серверомp99:
histogram_quantile(0.99, sum by (le, pod, node_id, function_name) (rate(milvus_proxy_req_latency_bucket{app_kubernetes_io_instance=~"$instance", app_kubernetes_io_name="$app_name", namespace="$namespace"}[2m])))
avg:
sum(increase(milvus_proxy_req_latency_sum{app_kubernetes_io_instance=~"$instance", app_kubernetes_io_name="$app_name", namespace="$namespace"}[2m])) by (pod, node_id, function_name) / sum(increase(milvus_proxy_req_latency_count{app_kubernetes_io_instance=~"$instance", app_kubernetes_io_name="$app_name", namespace="$namespace"}[2m])) by (pod, node_id, function_name)
milvus_proxy_req_latencyЗадержка всех типов запросов на получение
Количество байт запросов на вставку/удалениеКоличество байт запросов на вставку и удаление, полученных прокси в секунду за последние две минуты.sum(increase(milvus_proxy_receive_bytes_count{app_kubernetes_io_instance=~"$instance", app_kubernetes_io_name="$app_name", namespace="$namespace"}[2m])/120) by(pod, node_id)milvus_proxy_receive_bytes_countКоличество запросов на вставку и удаление.
Скорость отправки байтовКоличество байт в секунду, отправленных обратно клиенту, когда каждый прокси отвечает на запросы поиска и запросов в течение последних двух минут.sum(increase(milvus_proxy_send_bytes_count{app_kubernetes_io_instance=~"$instance", app_kubernetes_io_name="$app_name", namespace="$namespace"}[2m])/120) by(pod, node_id)milvus_proxy_send_bytes_countКоличество байт, отправленных обратно клиенту, пока каждый прокси отвечает на запросы поиска и запросов.

Корневой координатор

ПанельОписание панелиPromQL (язык запросов Prometheus)Используемые метрики MilvusОписание метрик Milvus
Количество прокси-узловКоличество созданных прокси.sum(milvus_rootcoord_proxy_num{app_kubernetes_io_instance=~"$instance", app_kubernetes_io_name="$app_name", namespace="$namespace"}) by (app_kubernetes_io_instance)milvus_rootcoord_proxy_numКоличество прокси-узлов.
Sync TimeСреднее, максимальное и минимальное количество эпохального времени, синхронизированного каждым корневым коордом в каждом физическом канале (PChannel).avg(milvus_rootcoord_sync_epoch_time{app_kubernetes_io_instance=~"$instance", app_kubernetes_io_name="$app_name", namespace="$namespace"}) by (app_kubernetes_io_instance) max(milvus_rootcoord_sync_epoch_time{app_kubernetes_io_instance=~"$instance", app_kubernetes_io_name="$app_name", namespace="$namespace"}) by (app_kubernetes_io_instance) min(milvus_rootcoord_sync_epoch_time{app_kubernetes_io_instance=~"$instance", app_kubernetes_io_name="$app_name", namespace="$namespace"}) by (app_kubernetes_io_instance)milvus_rootcoord_sync_epoch_timeВремя эпохи каждого физического канала (время Unix, миллисекунды, прошедшие с 1 января 1970 года).
Скорость выполнения DDL-запросовСостояние и количество DDL-запросов в секунду в течение последних двух минут.sum(increase(milvus_rootcoord_ddl_req_count{app_kubernetes_io_instance=~"$instance", app_kubernetes_io_name="$app_name", namespace="$namespace"}[2m])/120) by (status, function_name)milvus_rootcoord_ddl_req_countОбщее количество DDL-запросов, включая CreateCollection, DescribeCollection, DescribeSegments, HasCollection, ShowCollections, ShowPartitions и ShowSegments.
Латентность DDL-запросовСредняя задержка и 99-й процентиль задержки DDL-запросов за последние две минуты.p99:
histogram_quantile(0.99, sum by (le, function_name) (rate(milvus_rootcoord_ddl_req_latency_bucket{app_kubernetes_io_instance=~"$instance", app_kubernetes_io_name="$app_name", namespace="$namespace"}[2m])))
avg:
sum(increase(milvus_rootcoord_ddl_req_latency_sum{app_kubernetes_io_instance=~"$instance", app_kubernetes_io_name="$app_name", namespace="$namespace"}[2m])) by (function_name) / sum(increase(milvus_rootcoord_ddl_req_latency_count{app_kubernetes_io_instance=~"$instance", app_kubernetes_io_name="$app_name", namespace="$namespace"}[2m])) by (function_name)
milvus_rootcoord_ddl_req_latencyЗадержка всех типов DDL-запросов.
Sync Timetick LatencyСредняя задержка и 99-й процентиль времени, использованного root coord для синхронизации всех временных меток с PChannel в течение последних двух минут.p99:
histogram_quantile(0.99, sum by (le) (rate(milvus_rootcoord_sync_timetick_latency_bucket{app_kubernetes_io_instance=~"$instance", app_kubernetes_io_name="$app_name", namespace="$namespace"}[2m])))
avg:
sum(increase(milvus_rootcoord_sync_timetick_latency_sum{app_kubernetes_io_instance=~"$instance", app_kubernetes_io_name="$app_name", namespace="$namespace"}[2m])) / sum(increase(milvus_rootcoord_sync_timetick_latency_count{app_kubernetes_io_instance=~"$instance", app_kubernetes_io_name="$app_name", namespace="$namespace"}[2m]))
milvus_rootcoord_sync_timetick_latencyвремя, использованное корневым координатором для синхронизации всех временных меток с PChannel.
Скорость распределения идентификаторовКоличество идентификаторов, присваиваемых корневым коордом в секунду в течение последних двух минут.sum(increase(milvus_rootcoord_id_alloc_count{app_kubernetes_io_instance=~"$instance", app_kubernetes_io_name="$app_name", namespace="$namespace"}[2m])/120)milvus_rootcoord_id_alloc_countНакопленное количество идентификаторов, присвоенных корневым коордом.
Временная меткаПоследняя временная метка корневого коорда.milvus_rootcoord_timestamp{app_kubernetes_io_instance=~"$instance", app_kubernetes_io_name="$app_name", namespace="$namespace"}milvus_rootcoord_timestampПоследняя временная метка корневого координатора.
Сохраненные временные меткиПредварительно назначенные временные метки, которые root coord сохраняет в метахранилище.milvus_rootcoord_timestamp_saved{app_kubernetes_io_instance=~"$instance", app_kubernetes_io_name="$app_name", namespace="$namespace"}milvus_rootcoord_timestamp_savedПредварительно назначенные временные метки, которые root coord сохраняет в метахранилище.
Временные метки назначаются на 3 секунды раньше. Временная метка обновляется и сохраняется в метахранилище каждые 50 миллисекунд.
Количество коллекцийОбщее количество коллекций.sum(milvus_rootcoord_collection_num{app_kubernetes_io_instance=~"$instance", app_kubernetes_io_name="$app_name", namespace="$namespace"}) by (app_kubernetes_io_instance)milvus_rootcoord_collection_numОбщее количество коллекций, существующих в Milvus на данный момент.
Partition NumОбщее количество разделов.sum(milvus_rootcoord_partition_num{app_kubernetes_io_instance=~"$instance", app_kubernetes_io_name="$app_name", namespace="$namespace"}) by (app_kubernetes_io_instance)milvus_rootcoord_partition_numОбщее количество разделов, существующих в Milvus на данный момент.
DML Channel NumОбщее количество каналов DML.sum(milvus_rootcoord_dml_channel_num{app_kubernetes_io_instance=~"$instance", app_kubernetes_io_name="$app_name", namespace="$namespace"}) by (app_kubernetes_io_instance)milvus_rootcoord_dml_channel_numОбщее количество каналов DML, существующих в Milvus в настоящее время.
Msgstream NumОбщее количество msgstreams.sum(milvus_rootcoord_msgstream_obj_num{app_kubernetes_io_instance=~"$instance", app_kubernetes_io_name="$app_name", namespace="$namespace"}) by (app_kubernetes_io_instance)milvus_rootcoord_msgstream_obj_numОбщее количество msgstreams в Milvus на данный момент.
Credential NumОбщее количество учетных данных.sum(milvus_rootcoord_credential_num{app_kubernetes_io_instance=~"$instance", app_kubernetes_io_name="$app_name", namespace="$namespace"}) by (app_kubernetes_io_instance)milvus_rootcoord_credential_numОбщее количество учетных данных в Milvus на данный момент.
Задержка временного тикаСумма максимальной временной задержки тиков графиков потока на всех DataNodes и QueryNodes.sum(milvus_rootcoord_time_tick_delay{app_kubernetes_io_instance=~"$instance", app_kubernetes_io_name="$app_name", namespace="$namespace"}) by (app_kubernetes_io_instance)milvus_rootcoord_time_tick_delayМаксимальная временная задержка тиков графиков потока на каждом DataNode и QueryNode.

Координатор запросов

ПанельОписание панелиPromQL (язык запросов Prometheus)Используемые метрики MilvusОписание метрик Milvus
Collection Loaded NumКоличество коллекций, которые в данный момент загружены в память.sum(milvus_querycoord_collection_num{app_kubernetes_io_instance=~"$instance", app_kubernetes_io_name="$app_name", namespace="$namespace"}) by (app_kubernetes_io_instance)milvus_querycoord_collection_numКоличество коллекций, которые в данный момент загружены Milvus.
Entity Loaded NumКоличество сущностей, загруженных в память в данный момент.sum(milvus_querycoord_entity_num{app_kubernetes_io_instance=~"$instance", app_kubernetes_io_name="$app_name", namespace="$namespace"}) by (app_kubernetes_io_instance)milvus_querycoord_entitiy_numКоличество сущностей, загруженных Milvus в данный момент.
Скорость запросов на загрузкуКоличество запросов на загрузку в секунду за последние две минуты.sum(increase(milvus_querycoord_load_req_count{app_kubernetes_io_instance=~"$instance", app_kubernetes_io_name="$app_name", namespace="$namespace"}[2m])120) by (status)milvus_querycoord_load_req_countНакопленное количество запросов на загрузку.
Скорость запросов на освобождениеКоличество запросов на освобождение в секунду в течение последних двух минут.sum(increase(milvus_querycoord_release_req_count{app_kubernetes_io_instance=~"$instance", app_kubernetes_io_name="$app_name", namespace="$namespace"}[2m])/120) by (status)milvus_querycoord_release_req_countНакопленное количество запросов на освобождение.
Латентность запросов нагрузкиСредняя задержка и 99-й процентиль задержки запросов нагрузки за последние две минуты.p99:
histogram_quantile(0.99, sum by (le) (rate(milvus_querycoord_load_latency_bucket{app_kubernetes_io_instance=~"$instance", app_kubernetes_io_name="$app_name", namespace="$namespace"}[2m])))
avg:
sum(increase(milvus_querycoord_load_latency_sum{app_kubernetes_io_instance=~"$instance", app_kubernetes_io_name="$app_name", namespace="$namespace"}[2m])) / sum(increase(milvus_querycoord_load_latency_count{app_kubernetes_io_instance=~"$instance", app_kubernetes_io_name="$app_name", namespace="$namespace"}[2m]))
milvus_querycoord_load_latencyВремя, затраченное на выполнение запроса на нагрузку.
Задержка запроса на освобождениеСредняя задержка и 99-й процентиль задержки запросов на освобождение в течение последних двух минут.p99:
histogram_quantile(0.99, sum by (le) (rate(milvus_querycoord_release_latency_bucket{app_kubernetes_io_instance=~"$instance", app_kubernetes_io_name="$app_name", namespace="$namespace"}[2m])))
avg:
sum(increase(milvus_querycoord_release_latency_sum{app_kubernetes_io_instance=~"$instance", app_kubernetes_io_name="$app_name", namespace="$namespace"}[2m])) / sum(increase(milvus_querycoord_release_latency_count{app_kubernetes_io_instance=~"$instance", app_kubernetes_io_name="$app_name", namespace="$namespace"}[2m]))
milvus_querycoord_release_latencyВремя, затраченное на завершение запроса на освобождение.
Задача поднагрузкиКоличество задач подзагрузки.sum(milvus_querycoord_child_task_num{app_kubernetes_io_instance=~"$instance", app_kubernetes_io_name="$app_name", namespace="$namespace"}) by (app_kubernetes_io_instance)milvus_querycoord_child_task_numКоличество подзадач нагрузки.
Коорд запроса разбивает запрос нагрузки на несколько подзадач.
Родительское задание нагрузкиКоличество родительских заданий нагрузки.sum(milvus_querycoord_parent_task_num{app_kubernetes_io_instance=~"$instance", app_kubernetes_io_name="$app_name", namespace="$namespace"}) by (app_kubernetes_io_instance)milvus_querycoord_parent_task_numКоличество подзадач.
Каждый запрос нагрузки соответствует родительской задаче в очереди задач.
Латентность подзадач нагрузкиСредняя задержка и 99-й процентиль задержки задачи подзагрузки за последние две минуты.p99:
histogram_quantile(0.99, sum by (le) (rate(milvus_querycoord_child_task_latency_bucket{app_kubernetes_io_instance=~"$instance", app_kubernetes_io_name="$app_name", namespace="$namespace"}[2m])))
avg:
sum(increase(milvus_querycoord_child_task_latency_sum{app_kubernetes_io_instance=~"$instance", app_kubernetes_io_name="$app_name", namespace="$namespace"}[2m])) / sum(increase(milvus_querycoord_child_task_latency_count{app_kubernetes_io_instance=~"$instance", app_kubernetes_io_name="$app_name", namespace="$namespace"}[2m])) namespace"}[2m])))
milvus_querycoord_child_task_latencyВремя ожидания завершения задачи подзагрузки.
Query Node NumКоличество узлов запроса, управляемых коорд. запросом.sum(milvus_querycoord_querynode_num{app_kubernetes_io_instance=~"$instance", app_kubernetes_io_name="$app_name", namespace="$namespace"}) by (app_kubernetes_io_instance)milvus_querycoord_querynode_numКоличество узлов запроса, управляемых координатором запроса.

Узел запроса

ПанельОписание панелиPromQL (язык запросов Prometheus)Используемые метрики MilvusОписание метрик Milvus
Collection Loaded NumКоличество коллекций, загруженных в память каждым узлом запроса.sum(milvus_querynode_collection_num{app_kubernetes_io_instance=~"$instance", app_kubernetes_io_name="$app_name", namespace="$namespace"}) by (pod, node_id)milvus_querynode_collection_numКоличество коллекций, загруженных каждым узлом запроса.
Partition Loaded NumКоличество разделов, загруженных в память каждым узлом запроса.sum(milvus_querynode_partition_num{app_kubernetes_io_instance=~"$instance", app_kubernetes_io_name="$app_name", namespace="$namespace"}) by (pod, node_id)milvus_querynode_partition_numКоличество разделов, загруженных каждым узлом запроса.
Segment Loaded NumКоличество сегментов, загруженных в память каждым узлом запроса.sum(milvus_querynode_segment_num{app_kubernetes_io_instance=~"$instance", app_kubernetes_io_name="$app_name", namespace="$namespace"}) by (pod, node_id)milvus_querynode_segment_numКоличество сегментов, загруженных каждым узлом запроса.
Queryable Entity NumКоличество сущностей, доступных для запроса и поиска, на каждом узле запроса.sum(milvus_querynode_entity_num{app_kubernetes_io_instance=~"$instance", app_kubernetes_io_name="$app_name", namespace="$namespace"}) by (pod, node_id)milvus_querynode_entity_numКоличество сущностей, доступных для запроса и поиска, на каждом узле запроса.
Виртуальный канал DMLКоличество виртуальных каналов DML, просматриваемых каждым узлом запроса.sum(milvus_querynode_dml_vchannel_num{app_kubernetes_io_instance=~"$instance", app_kubernetes_io_name="$app_name", namespace="$namespace"}) by (pod, node_id)milvus_querynode_dml_vchannel_numКоличество виртуальных каналов DML, просматриваемых каждым узлом запроса.
Виртуальный дельта-каналКоличество дельта-каналов, просматриваемых каждым узлом запроса.sum(milvus_querynode_delta_vchannel_num{app_kubernetes_io_instance=~"$instance", app_kubernetes_io_name="$app_name", namespace="$namespace"}) by (pod, node_id)milvus_querynode_delta_vchannel_numКоличество дельта-каналов, просматриваемых каждым узлом запроса.
Количество потребителейКоличество потребителей в каждом узле запроса.sum(milvus_querynode_consumer_num{app_kubernetes_io_instance=~"$instance", app_kubernetes_io_name="$app_name", namespace="$namespace"}) by (pod, node_id)milvus_querynode_consumer_numКоличество потребителей в каждом узле запроса.
Количество поисковых запросовОбщее количество запросов на поиск и запрос, полученных в секунду каждым узлом запроса, и количество успешных запросов на поиск и запрос за последние две минуты.sum(increase(milvus_querynode_sq_req_count{app_kubernetes_io_instance=~"$instance", app_kubernetes_io_name="$app_name", namespace="$namespace"}[2m])/120) by (query_type, status, pod, node_id)milvus_querynode_sq_req_countНакопленное количество запросов поиска и запросов.
Латентность поисковых запросовСредняя задержка и 99-й процентиль времени, затраченного на поиск и запросы каждым узлом запроса в течение последних двух минут.
На этой панели отображается задержка запросов поиска и запросов, статус которых "успех" или "итог".
p99:
histogram_quantile(0.99, sum by (le, pod, node_id) (rate(milvus_querynode_sq_req_latency_bucket{app_kubernetes_io_instance=~"$instance", app_kubernetes_io_name="$app_name", namespace="$namespace"}[2m])))
avg:
sum(increase(milvus_querynode_sq_req_latency_sum{app_kubernetes_io_instance=~"$instance", app_kubernetes_io_name="$app_name", namespace="$namespace"}[2m])) by(pod, node_id, query_type) / sum(increase(milvus_querynode_sq_req_latency_count{app_kubernetes_io_instance=~"$instance", app_kubernetes_io_name="$app_name", namespace="$namespace"}[2m])) by(pod, node_id, query_type)
milvus_querynode_sq_req_latencyЗадержка поисковых запросов узла запроса.
Латентность поиска в очередиСредняя задержка и 99-й процентиль задержки запросов поиска и запросов в очереди за последние две минуты.p99:
histogram_quantile(0.99, sum by (le, pod, node_id, query_type) (rate(milvus_querynode_sq_queue_latency_bucket{app_kubernetes_io_instance=~"$instance", app_kubernetes_io_name="$app_name", namespace="$namespace"}[2m])))
avg:
sum(increase(milvus_querynode_sq_queue_latency_sum{app_kubernetes_io_instance=~"$instance", app_kubernetes_io_name="$app_name", namespace="$namespace"}[2m])) by(pod, node_id, query_type) / sum(increase(milvus_querynode_sq_queue_latency_count{app_kubernetes_io_instance=~"$instance", app_kubernetes_io_name="$app_name", namespace="$namespace"}[2m])) by(pod, node_id, query_type)
milvus_querynode_sq_queue_latencyЗадержка запросов поиска и запросов, полученных узлом запроса.
Латентность поискового сегментаСредняя задержка и 99-й процентиль времени, затраченного узлом запроса на поиск и запрос сегмента в течение последних двух минут.
Статус сегмента может быть закрытым или растущим.
p99:
histogram_quantile(0.99, sum by (le, query_type, segment_state, pod, node_id) (rate(milvus_querynode_sq_segment_latency_bucket{app_kubernetes_io_instance=~"$instance", app_kubernetes_io_name="$app_name", namespace="$namespace"}[2m])))
avg:
sum(increase(milvus_querynode_sq_segment_latency_sum{app_kubernetes_io_instance=~"$instance", app_kubernetes_io_name="$app_name", namespace="$namespace"}[2m])) by(pod, node_id, query_type, segment_state) / sum(increase(milvus_querynode_sq_segment_latency_count{app_kubernetes_io_instance=~"$instance", app_kubernetes_io_name="$app_name", namespace="$namespace"}[2m])) by(pod, node_id, query_type, segment_state)
milvus_querynode_sq_segment_latencyВремя, затрачиваемое узлом запроса на поиск и запрос каждого сегмента.
Задержка запроса сегментаСредняя задержка и 99-й процентиль времени, затраченного каждым узлом запроса на поиск и запрос в сегменте за последние две минуты.p99:
histogram_quantile(0.99, sum by (le, query_type, pod, node_id) (rate(milvus_querynode_sq_core_latency_bucket{app_kubernetes_io_instance=~"$instance", app_kubernetes_io_name="$app_name", namespace="$namespace"}[2m])))
avg:
sum(increase(milvus_querynode_sq_core_latency_sum{app_kubernetes_io_instance=~"$instance", app_kubernetes_io_name="$app_name", namespace="$namespace"}[2m])) by(pod, node_id, query_type) / sum(increase(milvus_querynode_sq_core_latency_count{app_kubernetes_io_instance=~"$instance", app_kubernetes_io_name="$app_name", namespace="$namespace"}[2m])) by(pod, node_id, query_type)
milvus_querynode_sq_core_latencyВремя, затрачиваемое каждым узлом запроса на поиск и запрос в segcore.
Латентность уменьшения поискаСредняя задержка и 99-й процентиль времени, использованного каждым узлом запроса на этапе уменьшения поиска или запроса в течение последних двух минут.p99:
histogram_quantile(0.99, sum by (le, pod, node_id, query_type) (rate(milvus_querynode_sq_reduce_latency_bucket{app_kubernetes_io_instance=~"$instance", app_kubernetes_io_name="$app_name", namespace="$namespace"}[2m])))
avg:
sum(increase(milvus_querynode_sq_reduce_latency_sum{app_kubernetes_io_instance=~"$instance", app_kubernetes_io_name="$app_name", namespace="$namespace"}[2m])) by(pod, node_id, query_type) / sum(increase(milvus_querynode_sq_reduce_latency_count{app_kubernetes_io_instance=~"$instance", app_kubernetes_io_name="$app_name", namespace="$namespace"}[2m])) by(pod, node_id, query_type)
milvus_querynode_sq_reduce_latencyВремя, затрачиваемое каждым запросом на этапе уменьшения.
Латентность сегмента нагрузкиСредняя задержка и 99-й процентиль времени, затрачиваемого каждым узлом запроса на загрузку сегмента за последние две минуты.p99:
histogram_quantile(0.99, sum by (le, pod, node_id) (rate(milvus_querynode_load_segment_latency_bucket{app_kubernetes_io_instance=~"$instance", app_kubernetes_io_name="$app_name", namespace="$namespace"}[2m])))
avg:
sum(increase(milvus_querynode_load_segment_latency_sum{app_kubernetes_io_instance=~"$instance", app_kubernetes_io_name="$app_name", namespace="$namespace"}[2m])) by(pod, node_id) / sum(increase(milvus_querynode_load_segment_latency_count{app_kubernetes_io_instance=~"$instance", app_kubernetes_io_name="$app_name", namespace="$namespace"}[2m])) by(pod, node_id)
milvus_querynode_load_segment_latency_bucketВремя, затрачиваемое каждым узлом запроса на загрузку сегмента.
Flowgraph NumКоличество графов потока в каждом узле запроса.sum(milvus_querynode_flowgraph_num{app_kubernetes_io_instance=~"$instance", app_kubernetes_io_name="$app_name", namespace="$namespace"}) by (pod, node_id)milvus_querynode_flowgraph_numКоличество графов потока в каждом узле запроса.
Длина очереди нерешенных задач чтенияДлина очереди неразрешенных запросов на чтение в каждом узле запроса.sum(milvus_querynode_read_task_unsolved_len{app_kubernetes_io_instance=~"$instance", app_kubernetes_io_name="$app_name", namespace="$namespace"}) by (pod, node_id)milvus_querynode_read_task_unsolved_lenДлина очереди неразрешенных запросов на чтение.
Длина готовой задачи чтенияДлина очереди запросов на чтение, которые должны быть выполнены в каждом узле запроса.sum(milvus_querynode_read_task_ready_len{app_kubernetes_io_instance=~"$instance", app_kubernetes_io_name="$app_name", namespace="$namespace"}) by (pod, node_id)milvus_querynode_read_task_ready_lenДлина очереди запросов на чтение, подлежащих выполнению.
Parallel Read Task NumКоличество параллельных запросов на чтение, выполняемых в настоящее время в каждом узле запроса.sum(milvus_querynode_read_task_concurrency{app_kubernetes_io_instance=~"$instance", app_kubernetes_io_name="$app_name", namespace="$namespace"}) by (pod, node_id)milvus_querynode_read_task_concurrencyКоличество параллельных запросов на чтение, выполняемых в данный момент.
Оценка использования ЦПИспользование ЦП каждым узлом запроса, оцененное планировщиком.sum(milvus_querynode_estimate_cpu_usage{app_kubernetes_io_instance=~"$instance", app_kubernetes_io_name="$app_name", namespace="$namespace"}) by (pod, node_id)milvus_querynode_estimate_cpu_usageИспользование процессора каждым узлом запроса, оцененное планировщиком.
Если значение равно 100, это означает, что используется целый виртуальный процессор (vCPU).
Размер группы поискаСреднее число и 99-й процентиль размера группы поиска (т. е. общее число исходных поисковых запросов в совокупности поисковых запросов, выполняемых каждым узлом запроса) за последние две минуты.p99:
histogram_quantile(0.99, sum by (le, pod, node_id) (rate(milvus_querynode_search_group_size_bucket{app_kubernetes_io_instance=~"$instance", app_kubernetes_io_name="$app_name", namespace="$namespace"}[2m])))
avg:
sum(increase(milvus_querynode_search_group_size_sum{app_kubernetes_io_instance=~"$instance", app_kubernetes_io_name="$app_name", namespace="$namespace"}[2m])) by(pod, node_id) / sum(increase(milvus_querynode_search_group_size_count{app_kubernetes_io_instance=~"$instance", app_kubernetes_io_name="$app_name", namespace="$namespace"}[2m])) by(pod, node_id)
milvus_querynode_load_segment_latency_bucketКоличество оригинальных поисковых задач среди объединенных поисковых задач из разных ведер (т. е. размер поисковой группы).
Поиск NQСреднее число и 99-й процентиль количества запросов (NQ), выполненных каждым узлом запроса в течение последних двух минут.p99:
histogram_quantile(0.99, sum by (le, pod, node_id) (rate(milvus_querynode_search_group_size_bucket{app_kubernetes_io_instance=~"$instance", app_kubernetes_io_name="$app_name", namespace="$namespace"}[2m])))
avg:
sum(increase(milvus_querynode_search_group_size_sum{app_kubernetes_io_instance=~"$instance", app_kubernetes_io_name="$app_name", namespace="$namespace"}[2m])) by(pod, node_id) / sum(increase(milvus_querynode_search_group_size_count{app_kubernetes_io_instance=~"$instance", app_kubernetes_io_name="$app_name", namespace="$namespace"}[2m])) by(pod, node_id)
milvus_querynode_load_segment_latency_bucketКоличество запросов (NQ) поисковых запросов.
Группа поиска NQСреднее число и 99-й процентиль NQ поисковых запросов, объединенных и выполненных каждым узлом запроса в течение последних двух минут.p99:
histogram_quantile(0.99, sum by (le, pod, node_id) (rate(milvus_querynode_search_group_nq_bucket{app_kubernetes_io_instance=~"$instance", app_kubernetes_io_name="$app_name", namespace="$namespace"}[2m])))
avg:
sum(increase(milvus_querynode_search_group_nq_sum{app_kubernetes_io_instance=~"$instance", app_kubernetes_io_name="$app_name", namespace="$namespace"}[2m])) by(pod, node_id) / sum(increase(milvus_querynode_search_group_nq_count{app_kubernetes_io_instance=~"$instance", app_kubernetes_io_name="$app_name", namespace="$namespace"}[2m])) by(pod, node_id)
milvus_querynode_load_segment_latency_bucketNQ поисковых запросов, объединенных из разных ведер.
Search Top_KСреднее число и 99-й процентиль Top_K поисковых запросов, выполненных каждым узлом запроса за последние две минуты.p99:
histogram_quantile(0.99, sum by (le, pod, node_id) (rate(milvus_querynode_search_topk_bucket{app_kubernetes_io_instance=~"$instance", app_kubernetes_io_name="$app_name", namespace="$namespace"}[2m])))
avg:
sum(increase(milvus_querynode_search_topk_sum{app_kubernetes_io_instance=~"$instance", app_kubernetes_io_name="$app_name", namespace="$namespace"}[2m])) by(pod, node_id) / sum(increase(milvus_querynode_search_topk_count{app_kubernetes_io_instance=~"$instance", app_kubernetes_io_name="$app_name", namespace="$namespace"}[2m])) by(pod, node_id)
milvus_querynode_load_segment_latency_bucketЧисло Top_K поисковых запросов.
Поисковая группа Top_KСреднее число и 99-й процентиль Top_K поисковых запросов, объединенных и выполненных каждым узлом запроса за последние две минуты.p99:
histogram_quantile(0.99, sum by (le, pod, node_id) (rate(milvus_querynode_search_group_topk_bucket{app_kubernetes_io_instance=~"$instance", app_kubernetes_io_name="$app_name", namespace="$namespace"}[2m])))
avg:
sum(increase(milvus_querynode_search_group_topk_sum{app_kubernetes_io_instance=~"$instance", app_kubernetes_io_name="$app_name", namespace="$namespace"}[2m])) by(pod, node_id) / sum(increase(milvus_querynode_search_group_topk_count{app_kubernetes_io_instance=~"$instance", app_kubernetes_io_name="$app_name", namespace="$namespace"}[2m])) by(pod, node_id)
milvus_querynode_load_segment_latency_bucketTop_K поисковых запросов, объединенных из разных ведер.
Количество вытесненных запросов на чтениеКоличество запросов на чтение, отклоненных в секунду каждым узлом запроса в течение последних двух минут.sum(increase(milvus_querynode_read_evicted_count{app_kubernetes_io_instance=~"$instance", app_kubernetes_io_name="$app_name", namespace="$namespace"}[2m])/120) by (pod, node_id)milvus_querynode_sq_req_countНакопленное количество запросов на чтение, отклоненных узлом запроса из-за ограничения трафика.

Координатор данных

ПанельОписание панелиPromQL (язык запросов Prometheus)Используемые метрики MilvusОписание метрик Milvus
Data Node NumКоличество узлов данных, управляемых data coord.sum(milvus_datacoord_datanode_num{app_kubernetes_io_instance=~"$instance", app_kubernetes_io_name="$app_name", namespace="$namespace"}) by (app_kubernetes_io_instance)milvus_datacoord_datanode_numКоличество узлов данных, управляемых координатором данных.
Segment NumКоличество всех типов сегментов, записанных в метаданных data coord.sum(milvus_datacoord_segment_num{app_kubernetes_io_instance=~"$instance", app_kubernetes_io_name="$app_name", namespace="$namespace"}) by (segment_state)milvus_datacoord_segment_numКоличество всех типов сегментов, записанных в метаданных data coord.
Типы сегментов включают: сброшенные, смытые, промытые, растущие и запечатанные.
Количество коллекцийКоличество коллекций, записанных в метаданные по коорд. данным.sum(milvus_datacoord_collection_num{app_kubernetes_io_instance=~"$instance", app_kubernetes_io_name="$app_name", namespace="$namespace"}) by (app_kubernetes_io_instance)milvus_datacoord_collection_numКоличество коллекций, записанных в метаданных по коорд. данным.
Stored RowsНакопленное количество строк валидных и промытых данных в коорд. данных.sum(milvus_datacoord_stored_rows_num{app_kubernetes_io_instance=~"$instance", app_kubernetes_io_name="$app_name", namespace="$namespace"}) by (app_kubernetes_io_instance)milvus_datacoord_stored_rows_numНакопленное количество строк валидных и смытых данных в коорд. данных.
Stored Rows RateСреднее количество строк, выгружаемых в секунду в течение последних двух минут.sum(increase(milvus_datacoord_stored_rows_count{app_kubernetes_io_instance=~"$instance", app_kubernetes_io_name="$app_name", namespace="$namespace"}[2m])/120) by (pod, node_id)milvus_datacoord_stored_rows_countНакопленное количество строк, промытых в data coord.
Время синхронизацииСреднее, максимальное и минимальное количество эпохального времени синхронизации данных в каждом физическом канале.avg(milvus_datacoord_sync_epoch_time{app_kubernetes_io_instance=~"$instance", app_kubernetes_io_name="$app_name", namespace="$namespace"}) by (app_kubernetes_io_instance) max(milvus_datacoord_sync_epoch_time{app_kubernetes_io_instance=~"$instance", app_kubernetes_io_name="$app_name", namespace="$namespace"}) by (app_kubernetes_io_instance) min(milvus_datacoord_sync_epoch_time{app_kubernetes_io_instance=~"$instance", app_kubernetes_io_name="$app_name", namespace="$namespace"}) by (app_kubernetes_io_instance)milvus_datacoord_sync_epoch_timeВремя эпохи каждого физического канала (время Unix, миллисекунды, прошедшие с 1 января 1970 года).
Размер хранимого бинлогаОбщий размер хранимого бинлога.sum(milvus_datacoord_stored_binlog_size{app_kubernetes_io_instance=~"$instance", app_kubernetes_io_name="$app_name", namespace="$namespace"}) by (app_kubernetes_io_instance)milvus_datacoord_stored_binlog_sizeОбщий размер бинлога, хранящегося в Milvus.

Узел данных

ПанельОписание панелиPromQL (язык запросов Prometheus)Используемые метрики MilvusОписание метрик Milvus
Flowgraph NumКоличество объектов flowgraph, соответствующих каждому узлу данных.sum(milvus_datanode_flowgraph_num{app_kubernetes_io_instance=~"$instance", app_kubernetes_io_name="$app_name", namespace="$namespace"}) by (pod, node_id)milvus_datanode_flowgraph_numКоличество объектов flowgraph.
Каждый шард в коллекции соответствует объекту flowgraph.
Скорость потребления строк сообщенийКоличество строк потоковых сообщений, потребляемых в секунду каждым узлом данных в течение последних двух минут.sum(increase(milvus_datanode_msg_rows_count{app_kubernetes_io_instance=~"$instance", app_kubernetes_io_name="$app_name", namespace="$namespace"}[2m])/120) by (msg_type, pod, node_id)milvus_datanode_msg_rows_countКоличество потребленных строк потоковых сообщений.
В настоящее время потоковые сообщения, подсчитываемые по узлам данных, включают только сообщения о вставке и удалении.
Скорость передачи данных при промывкеРазмер каждого смываемого сообщения, регистрируемого в секунду каждым узлом данных в течение последних двух минут.sum(increase(milvus_datanode_flushed_data_size{app_kubernetes_io_instance=~"$instance", app_kubernetes_io_name="$app_name", namespace="$namespace"}[2m])/120) by (msg_type, pod, node_id)milvus_datanode_flushed_data_sizeРазмер каждого переданного сообщения.
В настоящее время потоковые сообщения, подсчитанные по узлам данных, включают только сообщения о вставке и удалении.
Num потребителейКоличество потребителей, созданных на каждом узле данных.sum(milvus_datanode_consumer_num{app_kubernetes_io_instance=~"$instance", app_kubernetes_io_name="$app_name", namespace="$namespace"}) by (pod, node_id)milvus_datanode_consumer_numКоличество потребителей, созданных на каждом узле данных.
Каждый поток соответствует одному потребителю.
Producer NumКоличество производителей, созданных на каждом узле данных.sum(milvus_datanode_producer_num{app_kubernetes_io_instance=~"$instance", app_kubernetes_io_name="$app_name", namespace="$namespace"}) by (pod, node_id)milvus_datanode_producer_numКоличество потребителей, созданных на каждом узле данных.
Каждому осколку в коллекции соответствует производитель дельта-канала и производитель канала timetick.
Время синхронизацииСреднее, максимальное и минимальное количество времени эпохи, синхронизированное каждым узлом данных во всех физических темах.avg(milvus_datanode_sync_epoch_time{app_kubernetes_io_instance=~"$instance", app_kubernetes_io_name="$app_name", namespace="$namespace"}) by (pod, node_id) max(milvus_datanode_sync_epoch_time{app_kubernetes_io_instance=~"$instance", app_kubernetes_io_name="$app_name", namespace="$namespace"}) by (pod, node_id) min(milvus_datanode_sync_epoch_time{app_kubernetes_io_instance=~"$instance", app_kubernetes_io_name="$app_name", namespace="$namespace"}) by (pod, node_id)milvus_datanode_sync_epoch_timeВремя эпохи (время Unix, миллисекунды, прошедшие с 1 января 1970 года) каждой физической темы на узле данных.
Число непромытых сегментовКоличество непромытых сегментов, созданных на каждом узле данных.sum(milvus_datanode_unflushed_segment_num{app_kubernetes_io_instance=~"$instance", app_kubernetes_io_name="$app_name", namespace="$namespace"}) by (pod, node_id)milvus_datanode_unflushed_segment_numКоличество непромытых сегментов, созданных на каждом узле данных.
Encode Buffer LatencyСредняя задержка и 99-й процентиль времени, затраченного на кодирование буфера каждым узлом данных за последние две минуты.p99:
histogram_quantile(0.99, sum by (le, pod, node_id) (rate(milvus_datanode_encode_buffer_latency_bucket{app_kubernetes_io_instance=~"$instance", app_kubernetes_io_name="$app_name", namespace="$namespace"}[2m])))
avg:
sum(increase(milvus_datanode_encode_buffer_latency_sum{app_kubernetes_io_instance=~"$instance", app_kubernetes_io_name="$app_name", namespace="$namespace"}[2m])) by(pod, node_id) / sum(increase(milvus_datanode_encode_buffer_latency_count{app_kubernetes_io_instance=~"$instance", app_kubernetes_io_name="$app_name", namespace="$namespace"}[2m])) by(pod, node_id)
milvus_datanode_encode_buffer_latencyВремя, затрачиваемое каждым узлом данных на кодирование буфера.
Задержка сохранения данныхСредняя задержка и 99-й процентиль времени, затраченного на запись буфера в слой хранения каждым узлом данных за последние две минуты.p99:
histogram_quantile(0.99, sum by (le, pod, node_id) (rate(milvus_datanode_save_latency_bucket{app_kubernetes_io_instance=~"$instance", app_kubernetes_io_name="$app_name", namespace="$namespace"}[2m])))
avg:
sum(increase(milvus_datanode_save_latency_sum{app_kubernetes_io_instance=~"$instance", app_kubernetes_io_name="$app_name", namespace="$namespace"}[2m])) by(pod, node_id) / sum(increase(milvus_datanode_save_latency_count{app_kubernetes_io_instance=~"$instance", app_kubernetes_io_name="$app_name", namespace="$namespace"}[2m])) by(pod, node_id)
milvus_datanode_save_latencyВремя, затрачиваемое каждым узлом данных на запись буфера в слой хранения.
Частота операций промывкиКоличество раз, которое каждый узел данных промывает буфер в секунду в течение последних двух минут.sum(increase(milvus_datanode_flush_buffer_op_count{app_kubernetes_io_instance=~"$instance", app_kubernetes_io_name="$app_name", namespace="$namespace"}[2m])/120) by (status, pod, node_id)milvus_datanode_flush_buffer_op_countНакопленное количество раз, когда узел данных промывает буфер.
Скорость работы автопромывкиКоличество раз автопромывки буфера каждым узлом данных в секунду за последние две минуты.sum(increase(milvus_datanode_autoflush_buffer_op_count{app_kubernetes_io_instance=~"$instance", app_kubernetes_io_name="$app_name", namespace="$namespace"}[2m])/120) by (status, pod, node_id)milvus_datanode_autoflush_buffer_op_countНакопленное количество раз автоматической очистки буфера узлом данных.
Скорость запроса на промывкуКоличество раз, когда каждый узел данных получает запрос на промывку буфера в секунду за последние две минуты.sum(increase(milvus_datanode_flush_req_count{app_kubernetes_io_instance=~"$instance", app_kubernetes_io_name="$app_name", namespace="$namespace"}[2m])/120) by (status, pod, node_id)milvus_datanode_flush_req_countНакопленное количество раз, когда узел данных получает запрос на промывку от координатора данных.
Латентность уплотненияСредняя задержка и 99-й процентиль времени, затрачиваемого каждым узлом данных на выполнение задачи уплотнения в течение последних двух минут.p99:
histogram_quantile(0.99, sum by (le, pod, node_id) (rate(milvus_datanode_compaction_latency_bucket{app_kubernetes_io_instance=~"$instance", app_kubernetes_io_name="$app_name", namespace="$namespace"}[2m])))
avg:
sum(increase(milvus_datanode_compaction_latency_sum{app_kubernetes_io_instance=~"$instance", app_kubernetes_io_name="$app_name", namespace="$namespace"}[2m])) by(pod, node_id) / sum(increase(milvus_datanode_compaction_latency_count{app_kubernetes_io_instance=~"$instance", app_kubernetes_io_name="$app_name", namespace="$namespace"}[2m])) by(pod, node_id)
milvus_datanode_compaction_latencyВремя, необходимое каждому узлу данных для выполнения задачи уплотнения.

Индексный координатор

ПанельОписание панелиPromQL (язык запросов Prometheus)Используемые метрики MilvusОписание метрик Milvus
Index Request RateСреднее количество запросов на построение индекса, полученных в секунду за последние две минуты.sum(increase(milvus_indexcoord_indexreq_count{app_kubernetes_io_instance=~"$instance", app_kubernetes_io_name="$app_name", namespace="$namespace"}[2m])/120) by (status)milvus_indexcoord_indexreq_countКоличество полученных запросов на построение индекса.
Index Task CountКоличество всех задач индексирования, записанных в метаданных индекса.sum(milvus_indexcoord_indextask_count{app_kubernetes_io_instance=~"$instance", app_kubernetes_io_name="$app_name", namespace="$namespace"}) by (index_task_status)milvus_indexcoord_indextask_countКоличество всех задач индексирования, записанных в метаданных индекса.
Index Node NumКоличество управляемых индексных узлов.sum(milvus_indexcoord_indexnode_num{app_kubernetes_io_instance=~"$instance", app_kubernetes_io_name="$app_name", namespace="$namespace"}) by (app_kubernetes_io_instance)milvus_indexcoord_indexnode_numКоличество управляемых индексных узлов.

Индексный узел

ПанельОписание панелиPromQL (язык запросов Prometheus)Используемые метрики MilvusОписание метрик Milvus
Index Task RateСреднее количество заданий на построение индекса, получаемых каждым индексным узлом в секунду в течение последних двух минут.sum(increase(milvus_indexnode_index_task_count{app_kubernetes_io_instance=~"$instance", app_kubernetes_io_name="$app_name", namespace="$namespace"}[2m])/120) by (status, pod, node_id)milvus_indexnode_index_task_countКоличество полученных заданий на построение индекса.
Латентность поля загрузкиСредняя задержка и 99-й процентиль времени, затраченного каждым индексным узлом на загрузку данных сегментного поля каждый раз в течение последних двух минут.p99:
histogram_quantile(0.99, sum by (le, pod, node_id) (rate(milvus_indexnode_load_field_latency_bucket{app_kubernetes_io_instance=~"$instance", app_kubernetes_io_name="$app_name", namespace="$namespace"}[2m])))
avg:
sum(increase(milvus_indexnode_load_field_latency_sum{app_kubernetes_io_instance=~"$instance", app_kubernetes_io_name="$app_name", namespace="$namespace"}[2m])) by(pod, node_id) / sum(increase(milvus_indexnode_load_field_latency_count{app_kubernetes_io_instance=~"$instance", app_kubernetes_io_name="$app_name", namespace="$namespace"}[2m])) by(pod, node_id)
milvus_indexnode_load_field_latencyВремя, затраченное индексным узлом на загрузку данных сегментного поля.
Задержка декодирования поляСредняя задержка и 99-й процентиль времени, использованного каждым индексным узлом для кодирования данных поля каждый раз в течение последних двух минут.p99:
histogram_quantile(0.99, sum by (le, pod, node_id) (rate(milvus_indexnode_decode_field_latency_bucket{app_kubernetes_io_instance=~"$instance", app_kubernetes_io_name="$app_name", namespace="$namespace"}[2m])))
avg:
sum(increase(milvus_indexnode_decode_field_latency_sum{app_kubernetes_io_instance=~"$instance", app_kubernetes_io_name="$app_name", namespace="$namespace"}[2m])) by(pod, node_id) / sum(increase(milvus_indexnode_decode_field_latency_count{app_kubernetes_io_instance=~"$instance", app_kubernetes_io_name="$app_name", namespace="$namespace"}[2m])) by(pod, node_id)
milvus_indexnode_decode_field_latencyВремя, затраченное на декодирование полевых данных.
Задержка построения индексаСредняя задержка и 99-й процентиль времени, использованного каждым индексным узлом для построения индексов в течение последних двух минут.p99:
histogram_quantile(0.99, sum by (le, pod, node_id) (rate(milvus_indexnode_build_index_latency_bucket{app_kubernetes_io_instance=~"$instance", app_kubernetes_io_name="$app_name", namespace="$namespace"}[2m])))
avg:
sum(increase(milvus_indexnode_build_index_latency_sum{app_kubernetes_io_instance=~"$instance", app_kubernetes_io_name="$app_name", namespace="$namespace"}[2m])) by(pod, node_id) / sum(increase(milvus_indexnode_build_index_latency_count{app_kubernetes_io_instance=~"$instance", app_kubernetes_io_name="$app_name", namespace="$namespace"}[2m])) by(pod, node_id)
milvus_indexnode_build_index_latencyВремя, затраченное на создание индексов.
Латентность индекса кодированияСредняя задержка и 99-й процентиль времени, использованного каждым индексным узлом для кодирования индексных файлов в течение последних двух минут.p99:
histogram_quantile(0.99, sum by (le, pod, node_id) (rate(milvus_indexnode_encode_index_latency_bucket{app_kubernetes_io_instance=~"$instance", app_kubernetes_io_name="$app_name", namespace="$namespace"}[2m])))
avg:
sum(increase(milvus_indexnode_encode_index_latency_sum{app_kubernetes_io_instance=~"$instance", app_kubernetes_io_name="$app_name", namespace="$namespace"}[2m])) by(pod, node_id) / sum(increase(milvus_indexnode_encode_index_latency_count{app_kubernetes_io_instance=~"$instance", app_kubernetes_io_name="$app_name", namespace="$namespace"}[2m])) by(pod, node_id)
milvus_indexnode_encode_index_latencyВремя, затраченное на кодирование индексных файлов.
Задержка сохранения индексаСредняя задержка и 99-й процентиль времени, использованного каждым индексным узлом для сохранения индексных файлов в течение последних двух минут.p99:
histogram_quantile(0.99, sum by (le, pod, node_id) (rate(milvus_indexnode_save_index_latency_bucket{app_kubernetes_io_instance=~"$instance", app_kubernetes_io_name="$app_name", namespace="$namespace"}[2m])))
avg:
sum(increase(milvus_indexnode_save_index_latency_sum{app_kubernetes_io_instance=~"$instance", app_kubernetes_io_name="$app_name", namespace="$namespace"}[2m])) by(pod, node_id) / sum(increase(milvus_indexnode_save_index_latency_count{app_kubernetes_io_instance=~"$instance", app_kubernetes_io_name="$app_name", namespace="$namespace"}[2m])) by(pod, node_id)
milvus_indexnode_save_index_latencyВремя, затраченное на сохранение индексных файлов.

Попробуйте Managed Milvus бесплатно

Zilliz Cloud работает без проблем, поддерживается Milvus и в 10 раз быстрее.

Начать
Обратная связь

Была ли эта страница полезной?