milvus-logo
LFAI
Home
  • Guía de administración

Panel de métricas de Milvus

Milvus genera una lista de métricas detalladas de series temporales durante el tiempo de ejecución. Puede utilizar Prometheus y Grafana para visualizar las métricas. Este tema presenta las métricas de supervisión que se muestran en el panel de Milvus de Grafana.

La unidad de tiempo en este tema es milisegundos. Y "percentil 99" en este tema se refiere al hecho de que el 99 por ciento de las estadísticas de tiempo se controlan dentro de un cierto valor.

Recomendamos leer la descripción general del marco de supervisión de Milvus para comprender primero las métricas de Prometheus.

Proxy

PanelDescripción del panelPromQL (Lenguaje de consulta de Prometheus)Las métricas Milvus utilizadasDescripción de las métricas Milvus
Tasa de recuento de vectores de búsquedaEl número medio de vectores consultados por segundo por cada proxy en los últimos dos minutos.sum(increase(milvus_proxy_search_vectors_count{app_kubernetes_io_instance=~"$instance", app_kubernetes_io_name="$app_name", namespace="$namespace"}[2m])/120) by (pod, node_id)milvus_proxy_search_vectors_countNúmero acumulado de vectores consultados.
Índice de recuento de vectores insertadosNúmero medio de vectores insertados por segundo por cada proxy en los últimos dos minutos.sum(increase(milvus_proxy_insert_vectors_count{app_kubernetes_io_instance=~"$instance", app_kubernetes_io_name="$app_name", namespace="$namespace"}[2m])/120) by (pod, node_id)milvus_proxy_insert_vectors_countNúmero acumulado de vectores insertados.
Latencia de búsquedaLa latencia media y el percentil 99 de la latencia de recepción de solicitudes de búsqueda y consulta por cada proxy en los últimos dos minutos.p99:
histogram_quantile(0.99, sum by (le, query_type, pod, node_id) (rate(milvus_proxy_sq_latency_bucket{app_kubernetes_io_instance=~"$instance", app_kubernetes_io_name="$app_name", namespace="$namespace"}[2m])))
avg:
sum(increase(milvus_proxy_sq_latency_sum{app_kubernetes_io_instance=~"$instance", app_kubernetes_io_name="$app_name", namespace="$namespace"}[2m])) by (pod, node_id, query_type) / sum(increase(milvus_proxy_sq_latency_count{app_kubernetes_io_instance=~"$instance", app_kubernetes_io_name="$app_name", namespace="$namespace"}[2m])) by (pod, node_id, query_type)
milvus_proxy_sq_latencyLatencia de las solicitudes de búsqueda y consulta.
Latencia de búsqueda de coleccionesLa latencia media y el percentil 99 de la latencia de recepción de solicitudes de búsqueda y consulta de una colección específica por cada proxy en los últimos dos minutos.p99:
histogram_quantile(0.99, sum by (le, query_type, pod, node_id) (rate(milvus_proxy_collection_sq_latency_bucket{app_kubernetes_io_instance=~"$instance", app_kubernetes_io_name="$app_name", namespace="$namespace", collection_name=~"$collection"}[2m])))
avg:
sum(increase(milvus_proxy_collection_sq_latency_sum{app_kubernetes_io_instance=~"$instance", app_kubernetes_io_name="$app_name", namespace="$namespace", collection_name=~"$collection"}[2m])) by (pod, node_id, query_type) / sum(increase(milvus_proxy_collection_sq_latency_count{app_kubernetes_io_instance=~"$instance", app_kubernetes_io_name="$app_name", namespace="$namespace", collection_name=~"$collection"}[2m])) by (pod, node_id, query_type)
milvus_proxy_collection_sq_latency_sumLatencia de las solicitudes de búsqueda y consulta a una colección específica
Latencia de mutaciónLa latencia media y el percentil 99 de la latencia de recepción de solicitudes de mutación por cada proxy en los últimos dos minutos.p99:
histogram_quantile(0.99, sum by (le, msg_type, pod, node_id) (rate(milvus_proxy_mutation_latency_bucket{app_kubernetes_io_instance=~"$instance", app_kubernetes_io_name="$app_name", namespace="$namespace"}[2m])))
avg:
sum(increase(milvus_proxy_mutation_latency_sum{app_kubernetes_io_instance=~"$instance", app_kubernetes_io_name="$app_name", namespace="$namespace"}[2m])) by (pod, node_id, msg_type) / sum(increase(milvus_proxy_mutation_latency_count{app_kubernetes_io_instance=~"$instance", app_kubernetes_io_name="$app_name", namespace="$namespace"}[2m])) by (pod, node_id, msg_type)
milvus_proxy_mutation_latency_sumLatencia de las solicitudes de mutación.
Latencia de mutación de la colecciónLa latencia media y el percentil 99 de la latencia de recepción de solicitudes de mutación a una colección específica por cada proxy en los últimos dos minutos.p99:
histogram_quantile(0.99, sum by (le, query_type, pod, node_id) (rate(milvus_proxy_collection_sq_latency_bucket{app_kubernetes_io_instance=~"$instance", app_kubernetes_io_name="$app_name", namespace="$namespace", collection_name=~"$collection"}[2m])))
avg:
sum(increase(milvus_proxy_collection_sq_latency_sum{app_kubernetes_io_instance=~"$instance", app_kubernetes_io_name="$app_name", namespace="$namespace", collection_name=~"$collection"}[2m])) by (pod, node_id, query_type) / sum(increase(milvus_proxy_collection_sq_latency_count{app_kubernetes_io_instance=~"$instance", app_kubernetes_io_name="$app_name", namespace="$namespace", collection_name=~"$collection"}[2m])) by (pod, node_id, query_type)
milvus_proxy_collection_sq_latency_sumLatencia de las solicitudes de mutación a una colección específica
Latencia de los resultados de búsqueda en esperaLa latencia media y el percentil 99 de la latencia entre el envío de solicitudes de búsqueda y consulta y la recepción de resultados por proxy en los últimos dos minutos.p99:
histogram_quantile(0.99, sum by (le, query_type, pod, node_id) (rate(milvus_proxy_sq_wait_result_latency_bucket{app_kubernetes_io_instance=~"$instance", app_kubernetes_io_name="$app_name", namespace="$namespace"}[2m])))
avg:
sum(increase(milvus_proxy_sq_wait_result_latency_sum{app_kubernetes_io_instance=~"$instance", app_kubernetes_io_name="$app_name", namespace="$namespace"}[2m])) by (pod, node_id, query_type) / sum(increase(milvus_proxy_sq_wait_result_latency_count{app_kubernetes_io_instance=~"$instance", app_kubernetes_io_name="$app_name", namespace="$namespace"}[2m])) by (pod, node_id, query_type)
milvus_proxy_sq_wait_result_latencyLatencia entre el envío de solicitudes de búsqueda y consulta y la recepción de resultados.
Reducir la latencia de los resultados de búsquedaLa latencia media y el percentil 99 de la latencia de agregación de resultados de búsqueda y consulta por proxy en los últimos dos minutos.p99:
histogram_quantile(0.99, sum by (le, query_type, pod, node_id) (rate(milvus_proxy_sq_reduce_result_latency_bucket{app_kubernetes_io_instance=~"$instance", app_kubernetes_io_name="$app_name", namespace="$namespace"}[2m])))
avg:
sum(increase(milvus_proxy_sq_reduce_result_latency_sum{app_kubernetes_io_instance=~"$instance", app_kubernetes_io_name="$app_name", namespace="$namespace"}[2m])) by (pod, node_id, query_type) / sum(increase(milvus_proxy_sq_reduce_result_latency_count{app_kubernetes_io_instance=~"$instance", app_kubernetes_io_name="$app_name", namespace="$namespace"}[2m])) by (pod, node_id, query_type)
milvus_proxy_sq_reduce_result_latencyLatencia de la agregación de resultados de búsqueda y consulta devueltos por cada nodo de consulta.
Latencia de decodificación de resultados de búsquedaLa latencia media y el percentil 99 de la latencia de decodificación de resultados de búsqueda y consulta por proxy en los últimos dos minutos.p99:
histogram_quantile(0.99, sum by (le, query_type, pod, node_id) (rate(milvus_proxy_sq_decode_result_latency_bucket{app_kubernetes_io_instance=~"$instance", app_kubernetes_io_name="$app_name", namespace="$namespace"}[2m])))
avg:
sum(increase(milvus_proxy_sq_decode_result_latency_sum{app_kubernetes_io_instance=~"$instance", app_kubernetes_io_name="$app_name", namespace="$namespace"}[2m])) by (pod, node_id, query_type) / sum(increase(milvus_proxy_sq_decode_resultlatency_count{app_kubernetes_io_instance=~"$instance", app_kubernetes_io_name="$app_name", namespace="$namespace"}[2m])) by (pod, node_id, query_type)
milvus_proxy_sq_decode_result_latencyLatencia de descodificación de cada resultado de búsqueda y consulta.
Msg Stream Object NumEl número medio, máximo y mínimo de objetos msgstream creados por cada proxy en su tema físico correspondiente en los últimos dos minutos.avg(milvus_proxy_msgstream_obj_num{app_kubernetes_io_instance=~"$instance", app_kubernetes_io_name="$app_name", namespace="$namespace"}) by (pod, node_id) max(milvus_proxy_msgstream_obj_num{app_kubernetes_io_instance=~"$instance", app_kubernetes_io_name="$app_name", namespace="$namespace"}) by (pod, node_id) min(milvus_proxy_msgstream_obj_num{app_kubernetes_io_instance=~"$instance", app_kubernetes_io_name="$app_name", namespace="$namespace"}) by (pod, node_id)milvus_proxy_msgstream_obj_numEl número de objetos msgstream creados en cada tema físico.
Latencia de envío de mutacionesLa latencia media y el percentil 99 de la latencia de envío de solicitudes de inserción o eliminación por cada proxy en los últimos dos minutos.p99:
histogram_quantile(0.99, sum by (le, msg_type, pod, node_id) (rate(milvus_proxy_mutation_send_latency_bucket{app_kubernetes_io_instance=~"$instance", app_kubernetes_io_name="$app_name", namespace="$namespace"}[2m])))
avg:
sum(increase(milvus_proxy_mutation_send_latency_sum{app_kubernetes_io_instance=~"$instance", app_kubernetes_io_name="$app_name", namespace="$namespace"}[2m])) by (pod, node_id, msg_type) / sum(increase(milvus_proxy_mutation_send_latency_count{app_kubernetes_io_instance=~"$instance", app_kubernetes_io_name="$app_name", namespace="$namespace"}[2m])) by (pod, node_id, msg_type)
milvus_proxy_mutation_send_latencyLatencia de envío de solicitudes de inserción o borrado.
Índice de aciertos de cachéLa tasa media de aciertos en caché de las operaciones que incluyen GeCollectionID, GetCollectionInfo, y GetCollectionSchema por segundo en los últimos dos minutos.sum(increase(milvus_proxy_cache_hit_count{app_kubernetes_io_instance=~"$instance", app_kubernetes_io_name="$app_name", namespace="$namespace", cache_state="hit"}[2m])/120) by(cache_name, pod, node_id) / sum(increase(milvus_proxy_cache_hit_count{app_kubernetes_io_instance=~"$instance", app_kubernetes_io_name="$app_name", namespace="$namespace"}[2m])/120) by(cache_name, pod, node_id)milvus_proxy_cache_hit_countLas estadísticas de aciertos y fallos de cada operación de lectura de la caché.
Latencia de actualización de la cachéLa latencia media y el percentil 99 de la latencia de actualización de la caché por proxy en los últimos dos minutos.p99:
histogram_quantile(0.99, sum by (le, pod, node_id) (rate(milvus_proxy_cache_update_latency_bucket{app_kubernetes_io_instance=~"$instance", app_kubernetes_io_name="$app_name", namespace="$namespace"}[2m])))
avg:
sum(increase(milvus_proxy_cache_update_latency_sum{app_kubernetes_io_instance=~"$instance", app_kubernetes_io_name="$app_name", namespace="$namespace"}[2m])) by (pod, node_id) / sum(increase(milvus_proxy_cache_update_latency_count{app_kubernetes_io_instance=~"$instance", app_kubernetes_io_name="$app_name", namespace="$namespace"}[2m])) by (pod, node_id)
milvus_proxy_cache_update_latencyLa latencia de actualización de la caché cada vez.
Tiempo de sincronizaciónEl número medio, máximo y mínimo de tiempo de época sincronizado por cada proxy en su canal físico correspondiente.avg(milvus_proxy_sync_epoch_time{app_kubernetes_io_instance=~"$instance", app_kubernetes_io_name="$app_name", namespace="$namespace"}) by (pod, node_id) max(milvus_proxy_sync_epoch_time{app_kubernetes_io_instance=~"$instance", app_kubernetes_io_name="$app_name", namespace="$namespace"}) by (pod, node_id) min(milvus_proxy_sync_epoch_time{app_kubernetes_io_instance=~"$instance", app_kubernetes_io_name="$app_name", namespace="$namespace"}) by (pod, node_id)milvus_proxy_sync_epoch_timeEl tiempo de época de cada canal físico (tiempo Unix, los milisegundos transcurridos desde el 1 de enero de 1970).
Existe un ChannelName por defecto aparte de los canales físicos.
Aplicar latencia PKLa latencia media y el percentil 99 de la latencia de aplicación de clave primaria por cada proxy en los últimos dos minutos.p99:
histogram_quantile(0.99, sum by (le, pod, node_id) (rate(milvus_proxy_apply_pk_latency_bucket{app_kubernetes_io_instance=~"$instance", app_kubernetes_io_name="$app_name", namespace="$namespace"}[2m])))
avg:
sum(increase(milvus_proxy_apply_pk_latency_sum{app_kubernetes_io_instance=~"$instance", app_kubernetes_io_name="$app_name", namespace="$namespace"}[2m])) by (pod, node_id) / sum(increase(milvus_proxy_apply_pk_latency_count{app_kubernetes_io_instance=~"$instance", app_kubernetes_io_name="$app_name", namespace="$namespace"}[2m])) by (pod, node_id)
milvus_proxy_apply_pk_latencyLa latencia de aplicación de clave primaria.
Latencia de aplicación de marca de tiempoLa latencia media y el percentil 99 de la latencia de aplicación de marca de hora por cada proxy en los últimos dos minutos.p99:
histogram_quantile(0.99, sum by (le, pod, node_id) (rate(milvus_proxy_apply_timestamp_latency_bucket{app_kubernetes_io_instance=~"$instance", app_kubernetes_io_name="$app_name", namespace="$namespace"}[2m])))
avg:
sum(increase(milvus_proxy_apply_timestamp_latency_sum{app_kubernetes_io_instance=~"$instance", app_kubernetes_io_name="$app_name", namespace="$namespace"}[2m])) by (pod, node_id) / sum(increase(milvus_proxy_apply_timestamp_latency_count{app_kubernetes_io_instance=~"$instance", app_kubernetes_io_name="$app_name", namespace="$namespace"}[2m])) by (pod, node_id)
milvus_proxy_apply_timestamp_latencyLatencia de aplicación de la marca de tiempo.
Tasa de éxito de solicitudesEl número de solicitudes recibidas con éxito por segundo por cada proxy, con un desglose detallado de cada tipo de solicitud. Los posibles tipos de solicitud son DescribeCollection, DescribeIndex, GetCollectionStatistics, HasCollection, Search, Query, ShowPartitions, Insert, etc.
sum(increase(milvus_proxy_req_count{app_kubernetes_io_instance=~"$instance", app_kubernetes_io_name="$app_name", namespace="$namespace", status="success"}[2m])/120) by(function_name, pod, node_id)milvus_proxy_req_countEl número de todos los tipos de solicitudes recibidas
Tasa de solicitudes fallidasEl número de peticiones fallidas recibidas por segundo por cada proxy, con un desglose detallado de cada tipo de petición. Los posibles tipos de solicitud son DescribeCollection, DescribeIndex, GetCollectionStatistics, HasCollection, Search, Query, ShowPartitions, Insert, etc.
sum(increase(milvus_proxy_req_count{app_kubernetes_io_instance=~"$instance", app_kubernetes_io_name="$app_name", namespace="$namespace", status="fail"}[2m])/120) by(function_name, pod, node_id)milvus_proxy_req_countEl número de todos los tipos de peticiones recibidas
Latencia de la solicitudLa latencia media y el percentil 99 de la latencia de todos los tipos de recepción de solicitudes por cada proxyp99:
histogram_quantile(0.99, sum by (le, pod, node_id, function_name) (rate(milvus_proxy_req_latency_bucket{app_kubernetes_io_instance=~"$instance", app_kubernetes_io_name="$app_name", namespace="$namespace"}[2m])))
avg:
sum(increase(milvus_proxy_req_latency_sum{app_kubernetes_io_instance=~"$instance", app_kubernetes_io_name="$app_name", namespace="$namespace"}[2m])) by (pod, node_id, function_name) / sum(increase(milvus_proxy_req_latency_count{app_kubernetes_io_instance=~"$instance", app_kubernetes_io_name="$app_name", namespace="$namespace"}[2m])) by (pod, node_id, function_name)
milvus_proxy_req_latencyLatencia de todos los tipos de recepción de solicitudes
Tasa de bytes de solicitudes de inserción/borradoEl número de bytes de solicitudes de inserción y borrado recibidas por segundo por el proxy en los últimos dos minutos.sum(increase(milvus_proxy_receive_bytes_count{app_kubernetes_io_instance=~"$instance", app_kubernetes_io_name="$app_name", namespace="$namespace"}[2m])/120) by(pod, node_id)milvus_proxy_receive_bytes_countEl recuento de peticiones de inserción y borrado.
Tasa de bytes enviadosEl número de bytes por segundo enviados de vuelta al cliente mientras cada proxy está respondiendo a peticiones de búsqueda y consulta en los últimos dos minutos.sum(increase(milvus_proxy_send_bytes_count{app_kubernetes_io_instance=~"$instance", app_kubernetes_io_name="$app_name", namespace="$namespace"}[2m])/120) by(pod, node_id)milvus_proxy_send_bytes_countNúmero de bytes devueltos al cliente mientras cada proxy responde a solicitudes de búsqueda y consulta.

Coordinador raíz

PanelDescripción del panelPromQL (lenguaje de consulta de Prometheus)Las métricas Milvus utilizadasDescripción de las métricas Milvus
Número de nodo proxyEl número de proxies creados.sum(milvus_rootcoord_proxy_num{app_kubernetes_io_instance=~"$instance", app_kubernetes_io_name="$app_name", namespace="$namespace"}) by (app_kubernetes_io_instance)milvus_rootcoord_proxy_numEl número de proxies.
Tiempo de sincronizaciónEl número medio, máximo y mínimo de tiempo de época sincronizado por cada coordenada raíz en cada canal físico (PChannel).avg(milvus_rootcoord_sync_epoch_time{app_kubernetes_io_instance=~"$instance", app_kubernetes_io_name="$app_name", namespace="$namespace"}) by (app_kubernetes_io_instance) max(milvus_rootcoord_sync_epoch_time{app_kubernetes_io_instance=~"$instance", app_kubernetes_io_name="$app_name", namespace="$namespace"}) by (app_kubernetes_io_instance) min(milvus_rootcoord_sync_epoch_time{app_kubernetes_io_instance=~"$instance", app_kubernetes_io_name="$app_name", namespace="$namespace"}) by (app_kubernetes_io_instance)milvus_rootcoord_sync_epoch_timeEl tiempo de época de cada canal físico (tiempo Unix, los milisegundos transcurridos desde el 1 de enero de 1970).
Tasa de peticiones DDLEl estado y número de peticiones DDL por segundo en los últimos dos minutos.sum(increase(milvus_rootcoord_ddl_req_count{app_kubernetes_io_instance=~"$instance", app_kubernetes_io_name="$app_name", namespace="$namespace"}[2m])/120) by (status, function_name)milvus_rootcoord_ddl_req_countEl número total de peticiones DDL incluyendo CreateCollection, DescribeCollection, DescribeSegments, HasCollection, ShowCollections, ShowPartitions, y ShowSegments.
Latencia de las peticiones DDLLa latencia media y el percentil 99 de la latencia de peticiones DDL en los últimos dos minutos.p99:
histogram_quantile(0.99, sum by (le, function_name) (rate(milvus_rootcoord_ddl_req_latency_bucket{app_kubernetes_io_instance=~"$instance", app_kubernetes_io_name="$app_name", namespace="$namespace"}[2m])))
avg:
sum(increase(milvus_rootcoord_ddl_req_latency_sum{app_kubernetes_io_instance=~"$instance", app_kubernetes_io_name="$app_name", namespace="$namespace"}[2m])) by (function_name) / sum(increase(milvus_rootcoord_ddl_req_latency_count{app_kubernetes_io_instance=~"$instance", app_kubernetes_io_name="$app_name", namespace="$namespace"}[2m])) by (function_name)
milvus_rootcoord_ddl_req_latencyLa latencia de todos los tipos de peticiones DDL.
Latencia de cronología de sincronizaciónLa latencia media y el percentil 99 del tiempo utilizado por root coord para sincronizar todas las marcas de tiempo con PChannel en los últimos dos minutos.p99:
histogram_quantile(0.99, sum by (le) (rate(milvus_rootcoord_sync_timetick_latency_bucket{app_kubernetes_io_instance=~"$instance", app_kubernetes_io_name="$app_name", namespace="$namespace"}[2m])))
avg:
sum(increase(milvus_rootcoord_sync_timetick_latency_sum{app_kubernetes_io_instance=~"$instance", app_kubernetes_io_name="$app_name", namespace="$namespace"}[2m])) / sum(increase(milvus_rootcoord_sync_timetick_latency_count{app_kubernetes_io_instance=~"$instance", app_kubernetes_io_name="$app_name", namespace="$namespace"}[2m]))
milvus_rootcoord_sync_timetick_latencyel tiempo utilizado por el coordenador raíz para sincronizar todas las marcas de tiempo con pchannel.
Tasa de asignación de IDNúmero de ID asignados por root coord por segundo en los últimos dos minutos.sum(increase(milvus_rootcoord_id_alloc_count{app_kubernetes_io_instance=~"$instance", app_kubernetes_io_name="$app_name", namespace="$namespace"}[2m])/120)milvus_rootcoord_id_alloc_countEl número acumulado de IDs asignados por root coord.
Marca de tiempoFecha y hora más recientes de root coord.milvus_rootcoord_timestamp{app_kubernetes_io_instance=~"$instance", app_kubernetes_io_name="$app_name", namespace="$namespace"}milvus_rootcoord_timestampFecha y hora más recientes de root coord.
Marca de hora guardadaLas marcas de tiempo preasignadas que root coord guarda en metaalmacenamiento.milvus_rootcoord_timestamp_saved{app_kubernetes_io_instance=~"$instance", app_kubernetes_io_name="$app_name", namespace="$namespace"}milvus_rootcoord_timestamp_savedLas marcas de tiempo preasignadas que root coord guarda en metaalmacenamiento.
Las marcas de tiempo se asignan 3 segundos antes. Y la marca de tiempo se actualiza y guarda en meta almacenamiento cada 50 milisegundos.
Número de coleccionesEl número total de colecciones.sum(milvus_rootcoord_collection_num{app_kubernetes_io_instance=~"$instance", app_kubernetes_io_name="$app_name", namespace="$namespace"}) by (app_kubernetes_io_instance)milvus_rootcoord_collection_numEl número total de colecciones existentes en Milvus actualmente.
Número de particionesEl número total de particiones.sum(milvus_rootcoord_partition_num{app_kubernetes_io_instance=~"$instance", app_kubernetes_io_name="$app_name", namespace="$namespace"}) by (app_kubernetes_io_instance)milvus_rootcoord_partition_numEl número total de particiones existentes en Milvus actualmente.
Número de canales DMLEl número total de canales DML.sum(milvus_rootcoord_dml_channel_num{app_kubernetes_io_instance=~"$instance", app_kubernetes_io_name="$app_name", namespace="$namespace"}) by (app_kubernetes_io_instance)milvus_rootcoord_dml_channel_numEl número total de canales DML existentes en Milvus actualmente.
Número de MsgstreamEl número total de msgstreams.sum(milvus_rootcoord_msgstream_obj_num{app_kubernetes_io_instance=~"$instance", app_kubernetes_io_name="$app_name", namespace="$namespace"}) by (app_kubernetes_io_instance)milvus_rootcoord_msgstream_obj_numEl número total de msgstreams existentes en Milvus actualmente.
Número de credencialesEl número total de credenciales.sum(milvus_rootcoord_credential_num{app_kubernetes_io_instance=~"$instance", app_kubernetes_io_name="$app_name", namespace="$namespace"}) by (app_kubernetes_io_instance)milvus_rootcoord_credential_numEl número total de credenciales en Milvus actualmente.
Tiempo de retardoLa suma del tiempo máximo de retardo de los gráficos de flujo en todos los DataNodes y QueryNodes.sum(milvus_rootcoord_time_tick_delay{app_kubernetes_io_instance=~"$instance", app_kubernetes_io_name="$app_name", namespace="$namespace"}) by (app_kubernetes_io_instance)milvus_rootcoord_time_tick_delayEl tiempo máximo de retardo de los gráficos de flujo en cada DataNode y QueryNode.

Coordinador de consultas

PanelDescripción del panelPromQL (lenguaje de consulta de Prometheus)Las métricas Milvus utilizadasDescripción de las métricas de Milvus
Número de colecciones cargadasEl número de colecciones que están actualmente cargadas en memoria.sum(milvus_querycoord_collection_num{app_kubernetes_io_instance=~"$instance", app_kubernetes_io_name="$app_name", namespace="$namespace"}) by (app_kubernetes_io_instance)milvus_querycoord_collection_numEl número de colecciones cargadas actualmente por Milvus.
Número de entidades cargadasNúmero de entidades cargadas actualmente en memoria.sum(milvus_querycoord_entity_num{app_kubernetes_io_instance=~"$instance", app_kubernetes_io_name="$app_name", namespace="$namespace"}) by (app_kubernetes_io_instance)milvus_querycoord_entitiy_numEl número de entidades cargadas actualmente por Milvus.
Tasa de solicitudes de cargaNúmero de solicitudes de carga por segundo en los últimos dos minutos.sum(increase(milvus_querycoord_load_req_count{app_kubernetes_io_instance=~"$instance", app_kubernetes_io_name="$app_name", namespace="$namespace"}[2m])120) by (status)milvus_querycoord_load_req_countEl número acumulado de peticiones de carga.
Tasa de solicitudes de liberaciónNúmero de solicitudes de liberación por segundo en los últimos dos minutos.sum(increase(milvus_querycoord_release_req_count{app_kubernetes_io_instance=~"$instance", app_kubernetes_io_name="$app_name", namespace="$namespace"}[2m])/120) by (status)milvus_querycoord_release_req_countNúmero acumulado de solicitudes de liberación.
Latencia de las solicitudes de cargaLa latencia media y el percentil 99 de latencia de solicitudes de carga en los últimos dos minutos.p99:
histogram_quantile(0.99, sum by (le) (rate(milvus_querycoord_load_latency_bucket{app_kubernetes_io_instance=~"$instance", app_kubernetes_io_name="$app_name", namespace="$namespace"}[2m])))
avg:
sum(increase(milvus_querycoord_load_latency_sum{app_kubernetes_io_instance=~"$instance", app_kubernetes_io_name="$app_name", namespace="$namespace"}[2m])) / sum(increase(milvus_querycoord_load_latency_count{app_kubernetes_io_instance=~"$instance", app_kubernetes_io_name="$app_name", namespace="$namespace"}[2m]))
milvus_querycoord_load_latencyEl tiempo utilizado para completar una solicitud de carga.
Latencia de solicitud de liberaciónLa latencia media y el percentil 99 de latencia de solicitud de liberación en los últimos dos minutos.p99:
histogram_quantile(0.99, sum by (le) (rate(milvus_querycoord_release_latency_bucket{app_kubernetes_io_instance=~"$instance", app_kubernetes_io_name="$app_name", namespace="$namespace"}[2m])))
avg:
sum(increase(milvus_querycoord_release_latency_sum{app_kubernetes_io_instance=~"$instance", app_kubernetes_io_name="$app_name", namespace="$namespace"}[2m])) / sum(increase(milvus_querycoord_release_latency_count{app_kubernetes_io_instance=~"$instance", app_kubernetes_io_name="$app_name", namespace="$namespace"}[2m]))
milvus_querycoord_release_latencyEl tiempo utilizado para completar una solicitud de liberación.
Tarea de subcargaEl número de tareas de subcarga.sum(milvus_querycoord_child_task_num{app_kubernetes_io_instance=~"$instance", app_kubernetes_io_name="$app_name", namespace="$namespace"}) by (app_kubernetes_io_instance)milvus_querycoord_child_task_numEl número de subtareas de carga.
Una coordenada de consulta divide una solicitud de carga en varias subtareas de carga.
Tarea de carga principalNúmero de tareas de carga principales.sum(milvus_querycoord_parent_task_num{app_kubernetes_io_instance=~"$instance", app_kubernetes_io_name="$app_name", namespace="$namespace"}) by (app_kubernetes_io_instance)milvus_querycoord_parent_task_numNúmero de subtareas de carga.
Cada solicitud de carga corresponde a una tarea padre en la cola de tareas.
Latencia de la subtarea de cargaLa latencia media y el percentil 99 de la latencia de una tarea de subcarga en los últimos dos minutos.p99:
histogram_quantile(0.99, sum by (le) (rate(milvus_querycoord_child_task_latency_bucket{app_kubernetes_io_instance=~"$instance", app_kubernetes_io_name="$app_name", namespace="$namespace"}[2m])))
avg:
sum(increase(milvus_querycoord_child_task_latency_sum{app_kubernetes_io_instance=~"$instance", app_kubernetes_io_name="$app_name", namespace="$namespace"}[2m])) / sum(increase(milvus_querycoord_child_task_latency_count{app_kubernetes_io_instance=~"$instance", app_kubernetes_io_name="$app_name", namespace="$namespace"}[2m])) namespace"}[2m])))
milvus_querycoord_child_task_latencyLa latencia para completar una tarea de subcarga.
Número de nodos de consultaNúmero de nodos de consulta gestionados por el coordinador de consultas.sum(milvus_querycoord_querynode_num{app_kubernetes_io_instance=~"$instance", app_kubernetes_io_name="$app_name", namespace="$namespace"}) by (app_kubernetes_io_instance)milvus_querycoord_querynode_numNúmero de nodos de consulta gestionados por query coord.

Nodo de consulta

PanelDescripción del panelPromQL (lenguaje de consulta de Prometheus)Las métricas Milvus utilizadasDescripción de las métricas de Milvus
Número de colecciones cargadasEl número de colecciones cargadas en memoria por cada nodo de consulta.sum(milvus_querynode_collection_num{app_kubernetes_io_instance=~"$instance", app_kubernetes_io_name="$app_name", namespace="$namespace"}) by (pod, node_id)milvus_querynode_collection_numNúmero de colecciones cargadas por cada nodo de consulta.
Número de particiones cargadasNúmero de particiones cargadas en memoria por cada nodo de consulta.sum(milvus_querynode_partition_num{app_kubernetes_io_instance=~"$instance", app_kubernetes_io_name="$app_name", namespace="$namespace"}) by (pod, node_id)milvus_querynode_partition_numEl número de particiones cargadas por cada nodo de consulta.
Número de segmentos cargadosEl número de segmentos cargados en memoria por cada nodo de consulta.sum(milvus_querynode_segment_num{app_kubernetes_io_instance=~"$instance", app_kubernetes_io_name="$app_name", namespace="$namespace"}) by (pod, node_id)milvus_querynode_segment_numEl número de segmentos cargados por cada nodo de consulta.
Número de entidades consultablesNúmero de entidades consultables y buscables en cada nodo de consulta.sum(milvus_querynode_entity_num{app_kubernetes_io_instance=~"$instance", app_kubernetes_io_name="$app_name", namespace="$namespace"}) by (pod, node_id)milvus_querynode_entity_numEl número de entidades consultables y buscables en cada nodo de consulta.
Canal virtual DMLNúmero de canales virtuales DML observados por cada nodo de consulta.sum(milvus_querynode_dml_vchannel_num{app_kubernetes_io_instance=~"$instance", app_kubernetes_io_name="$app_name", namespace="$namespace"}) by (pod, node_id)milvus_querynode_dml_vchannel_numNúmero de canales virtuales DML observados por cada nodo de consulta.
Canal virtual deltaNúmero de canales delta observados por cada nodo de consulta.sum(milvus_querynode_delta_vchannel_num{app_kubernetes_io_instance=~"$instance", app_kubernetes_io_name="$app_name", namespace="$namespace"}) by (pod, node_id)milvus_querynode_delta_vchannel_numNúmero de canales delta observados por cada nodo de consulta.
Número de consumidoresNúmero de consumidores en cada nodo de consulta.sum(milvus_querynode_consumer_num{app_kubernetes_io_instance=~"$instance", app_kubernetes_io_name="$app_name", namespace="$namespace"}) by (pod, node_id)milvus_querynode_consumer_numNúmero de consumidores en cada nodo de consulta.
Tasa de solicitudes de búsquedaEl número total de solicitudes de búsqueda y consulta recibidas por segundo por cada nodo de consulta y el número de solicitudes de búsqueda y consulta realizadas con éxito en los últimos dos minutos.sum(increase(milvus_querynode_sq_req_count{app_kubernetes_io_instance=~"$instance", app_kubernetes_io_name="$app_name", namespace="$namespace"}[2m])/120) by (query_type, status, pod, node_id)milvus_querynode_sq_req_countNúmero acumulado de peticiones de búsqueda y consulta.
Latencia de las solicitudes de búsquedaLa latencia media y el percentil 99 del tiempo utilizado en las peticiones de búsqueda y consulta por cada nodo de consulta en los últimos dos minutos.
Este panel muestra la latencia de las peticiones de búsqueda y consulta cuyo estado es "éxito" o "total".
p99:
histogram_quantile(0.99, sum by (le, pod, node_id) (rate(milvus_querynode_sq_req_latency_bucket{app_kubernetes_io_instance=~"$instance", app_kubernetes_io_name="$app_name", namespace="$namespace"}[2m])))
avg:
sum(increase(milvus_querynode_sq_req_latency_sum{app_kubernetes_io_instance=~"$instance", app_kubernetes_io_name="$app_name", namespace="$namespace"}[2m])) by(pod, node_id, query_type) / sum(increase(milvus_querynode_sq_req_latency_count{app_kubernetes_io_instance=~"$instance", app_kubernetes_io_name="$app_name", namespace="$namespace"}[2m])) by(pod, node_id, query_type)
milvus_querynode_sq_req_latencyLa latencia de las peticiones de búsqueda del nodo de consulta.
Latencia de búsqueda en colaLa latencia media y el percentil 99 de la latencia de las solicitudes de búsqueda y consulta en cola en los últimos dos minutos.p99:
histogram_quantile(0.99, sum by (le, pod, node_id, query_type) (rate(milvus_querynode_sq_queue_latency_bucket{app_kubernetes_io_instance=~"$instance", app_kubernetes_io_name="$app_name", namespace="$namespace"}[2m])))
avg:
sum(increase(milvus_querynode_sq_queue_latency_sum{app_kubernetes_io_instance=~"$instance", app_kubernetes_io_name="$app_name", namespace="$namespace"}[2m])) by(pod, node_id, query_type) / sum(increase(milvus_querynode_sq_queue_latency_count{app_kubernetes_io_instance=~"$instance", app_kubernetes_io_name="$app_name", namespace="$namespace"}[2m])) by(pod, node_id, query_type)
milvus_querynode_sq_queue_latencyLa latencia de las peticiones de búsqueda y consulta recibidas por el nodo de consulta.
Latencia del segmento de búsquedaLa latencia media y el percentil 99 del tiempo que tarda cada nodo de consulta en buscar y consultar un segmento en los últimos dos minutos.
El estado de un segmento puede ser cerrado o en crecimiento.
p99:
histogram_quantile(0.99, sum by (le, query_type, segment_state, pod, node_id) (rate(milvus_querynode_sq_segment_latency_bucket{app_kubernetes_io_instance=~"$instance", app_kubernetes_io_name="$app_name", namespace="$namespace"}[2m])))
avg:
sum(increase(milvus_querynode_sq_segment_latency_sum{app_kubernetes_io_instance=~"$instance", app_kubernetes_io_name="$app_name", namespace="$namespace"}[2m])) by(pod, node_id, query_type, segment_state) / sum(increase(milvus_querynode_sq_segment_latency_count{app_kubernetes_io_instance=~"$instance", app_kubernetes_io_name="$app_name", namespace="$namespace"}[2m])) by(pod, node_id, query_type, segment_state)
milvus_querynode_sq_segment_latencyTiempo que tarda cada nodo de consulta en buscar y consultar cada segmento.
Latencia de solicitud SegcoreLa latencia media y el percentil 99 del tiempo que cada nodo de consulta tarda en buscar y consultar en segcore en los últimos dos minutos.p99:
histogram_quantile(0.99, sum by (le, query_type, pod, node_id) (rate(milvus_querynode_sq_core_latency_bucket{app_kubernetes_io_instance=~"$instance", app_kubernetes_io_name="$app_name", namespace="$namespace"}[2m])))
avg:
sum(increase(milvus_querynode_sq_core_latency_sum{app_kubernetes_io_instance=~"$instance", app_kubernetes_io_name="$app_name", namespace="$namespace"}[2m])) by(pod, node_id, query_type) / sum(increase(milvus_querynode_sq_core_latency_count{app_kubernetes_io_instance=~"$instance", app_kubernetes_io_name="$app_name", namespace="$namespace"}[2m])) by(pod, node_id, query_type)
milvus_querynode_sq_core_latencyEl tiempo que tarda cada nodo de consulta en buscar y consultar en segcore.
Latencia de reducción de búsquedaLa latencia media y el percentil 99 del tiempo utilizado por cada nodo de consulta durante la etapa de reducción de una búsqueda o consulta en los últimos dos minutos.p99:
histogram_quantile(0.99, sum by (le, pod, node_id, query_type) (rate(milvus_querynode_sq_reduce_latency_bucket{app_kubernetes_io_instance=~"$instance", app_kubernetes_io_name="$app_name", namespace="$namespace"}[2m])))
avg:
sum(increase(milvus_querynode_sq_reduce_latency_sum{app_kubernetes_io_instance=~"$instance", app_kubernetes_io_name="$app_name", namespace="$namespace"}[2m])) by(pod, node_id, query_type) / sum(increase(milvus_querynode_sq_reduce_latency_count{app_kubernetes_io_instance=~"$instance", app_kubernetes_io_name="$app_name", namespace="$namespace"}[2m])) by(pod, node_id, query_type)
milvus_querynode_sq_reduce_latencyTiempo empleado por cada consulta durante la etapa de reducción.
Latencia del segmento de cargaLa latencia media y el percentil 99 del tiempo que tarda cada nodo de consulta en cargar un segmento en los últimos dos minutos.p99:
histogram_quantile(0.99, sum by (le, pod, node_id) (rate(milvus_querynode_load_segment_latency_bucket{app_kubernetes_io_instance=~"$instance", app_kubernetes_io_name="$app_name", namespace="$namespace"}[2m])))
avg:
sum(increase(milvus_querynode_load_segment_latency_sum{app_kubernetes_io_instance=~"$instance", app_kubernetes_io_name="$app_name", namespace="$namespace"}[2m])) by(pod, node_id) / sum(increase(milvus_querynode_load_segment_latency_count{app_kubernetes_io_instance=~"$instance", app_kubernetes_io_name="$app_name", namespace="$namespace"}[2m])) by(pod, node_id)
milvus_querynode_load_segment_latency_bucketTiempo que tarda cada nodo de consulta en cargar un segmento.
Número de diagramas de flujoNúmero de diagramas de flujo en cada nodo de consulta.sum(milvus_querynode_flowgraph_num{app_kubernetes_io_instance=~"$instance", app_kubernetes_io_name="$app_name", namespace="$namespace"}) by (pod, node_id)milvus_querynode_flowgraph_numNúmero de diagramas de flujo en cada nodo de consulta.
Longitud de tareas de lectura sin resolverLa longitud de la cola de peticiones de lectura sin resolver en cada nodo de consulta.sum(milvus_querynode_read_task_unsolved_len{app_kubernetes_io_instance=~"$instance", app_kubernetes_io_name="$app_name", namespace="$namespace"}) by (pod, node_id)milvus_querynode_read_task_unsolved_lenLongitud de la cola de peticiones de lectura sin resolver.
Longitud de tarea de lectura listaLongitud de la cola de peticiones de lectura por ejecutar en cada nodo de consulta.sum(milvus_querynode_read_task_ready_len{app_kubernetes_io_instance=~"$instance", app_kubernetes_io_name="$app_name", namespace="$namespace"}) by (pod, node_id)milvus_querynode_read_task_ready_lenLongitud de la cola de peticiones de lectura por ejecutar.
Número de tareas de lectura paralelasNúmero de peticiones de lectura concurrentes ejecutadas actualmente en cada nodo de consulta.sum(milvus_querynode_read_task_concurrency{app_kubernetes_io_instance=~"$instance", app_kubernetes_io_name="$app_name", namespace="$namespace"}) by (pod, node_id)milvus_querynode_read_task_concurrencyEl número de peticiones de lectura concurrentes ejecutadas actualmente.
Uso estimado de CPUEl uso de CPU por cada nodo de consulta estimado por el planificador.sum(milvus_querynode_estimate_cpu_usage{app_kubernetes_io_instance=~"$instance", app_kubernetes_io_name="$app_name", namespace="$namespace"}) by (pod, node_id)milvus_querynode_estimate_cpu_usageEl uso de CPU por cada nodo de consulta estimado por el planificador.
Cuando el valor es 100, significa que se utiliza toda una CPU virtual (vCPU).
Tamaño del grupo de búsquedaEl número medio y el percentil 99 del tamaño del grupo de búsqueda (es decir, el número total de peticiones de búsqueda originales en las peticiones de búsqueda combinadas ejecutadas por cada nodo de consulta) en los últimos dos minutos.p99:
histogram_quantile(0.99, sum by (le, pod, node_id) (rate(milvus_querynode_search_group_size_bucket{app_kubernetes_io_instance=~"$instance", app_kubernetes_io_name="$app_name", namespace="$namespace"}[2m])))
avg:
sum(increase(milvus_querynode_search_group_size_sum{app_kubernetes_io_instance=~"$instance", app_kubernetes_io_name="$app_name", namespace="$namespace"}[2m])) by(pod, node_id) / sum(increase(milvus_querynode_search_group_size_count{app_kubernetes_io_instance=~"$instance", app_kubernetes_io_name="$app_name", namespace="$namespace"}[2m])) by(pod, node_id)
milvus_querynode_load_segment_latency_bucketEl número de tareas de búsqueda originales entre las tareas de búsqueda combinadas de diferentes buckets (es decir, el tamaño del grupo de búsqueda).
Búsqueda NQEl número medio y el percentil 99 del número de consultas (NQ) realizadas mientras cada nodo de consulta ejecuta peticiones de búsqueda en los últimos dos minutos.p99:
histogram_quantile(0.99, sum by (le, pod, node_id) (rate(milvus_querynode_search_group_size_bucket{app_kubernetes_io_instance=~"$instance", app_kubernetes_io_name="$app_name", namespace="$namespace"}[2m])))
avg:
sum(increase(milvus_querynode_search_group_size_sum{app_kubernetes_io_instance=~"$instance", app_kubernetes_io_name="$app_name", namespace="$namespace"}[2m])) by(pod, node_id) / sum(increase(milvus_querynode_search_group_size_count{app_kubernetes_io_instance=~"$instance", app_kubernetes_io_name="$app_name", namespace="$namespace"}[2m])) by(pod, node_id)
milvus_querynode_load_segment_latency_bucketNúmero de consultas (NQ) de solicitudes de búsqueda.
Grupo de búsqueda NQEl número medio y el percentil 99 de NQ de solicitudes de búsqueda combinadas y ejecutadas por cada nodo de consulta en los últimos dos minutos.p99:
histogram_quantile(0.99, sum by (le, pod, node_id) (rate(milvus_querynode_search_group_nq_bucket{app_kubernetes_io_instance=~"$instance", app_kubernetes_io_name="$app_name", namespace="$namespace"}[2m])))
avg:
sum(increase(milvus_querynode_search_group_nq_sum{app_kubernetes_io_instance=~"$instance", app_kubernetes_io_name="$app_name", namespace="$namespace"}[2m])) by(pod, node_id) / sum(increase(milvus_querynode_search_group_nq_count{app_kubernetes_io_instance=~"$instance", app_kubernetes_io_name="$app_name", namespace="$namespace"}[2m])) by(pod, node_id)
milvus_querynode_load_segment_latency_bucketEl NQ de peticiones de búsqueda combinadas de diferentes buckets.
Búsqueda Top_KEl número medio y el percentil 99 de Top_K de solicitudes de búsqueda ejecutadas por cada nodo de consulta en los últimos dos minutos.p99:
histogram_quantile(0.99, sum by (le, pod, node_id) (rate(milvus_querynode_search_topk_bucket{app_kubernetes_io_instance=~"$instance", app_kubernetes_io_name="$app_name", namespace="$namespace"}[2m])))
avg:
sum(increase(milvus_querynode_search_topk_sum{app_kubernetes_io_instance=~"$instance", app_kubernetes_io_name="$app_name", namespace="$namespace"}[2m])) by(pod, node_id) / sum(increase(milvus_querynode_search_topk_count{app_kubernetes_io_instance=~"$instance", app_kubernetes_io_name="$app_name", namespace="$namespace"}[2m])) by(pod, node_id)
milvus_querynode_load_segment_latency_bucketEl Top_K de las peticiones de búsqueda.
Grupo de búsqueda Top_KEl número medio y el percentil 99 de Top_K de peticiones de búsqueda combinadas y ejecutadas por cada nodo de consulta en los últimos dos minutos.p99:
histogram_quantile(0.99, sum by (le, pod, node_id) (rate(milvus_querynode_search_group_topk_bucket{app_kubernetes_io_instance=~"$instance", app_kubernetes_io_name="$app_name", namespace="$namespace"}[2m])))
avg:
sum(increase(milvus_querynode_search_group_topk_sum{app_kubernetes_io_instance=~"$instance", app_kubernetes_io_name="$app_name", namespace="$namespace"}[2m])) by(pod, node_id) / sum(increase(milvus_querynode_search_group_topk_count{app_kubernetes_io_instance=~"$instance", app_kubernetes_io_name="$app_name", namespace="$namespace"}[2m])) by(pod, node_id)
milvus_querynode_load_segment_latency_bucketEl Top_K de peticiones de búsqueda combinadas de diferentes buckets .
Tasa de solicitudes de lectura desalojadasNúmero de peticiones de lectura desalojadas por segundo por cada nodo de búsqueda en los últimos dos minutos.sum(increase(milvus_querynode_read_evicted_count{app_kubernetes_io_instance=~"$instance", app_kubernetes_io_name="$app_name", namespace="$namespace"}[2m])/120) by (pod, node_id)milvus_querynode_sq_req_countNúmero acumulado de solicitudes de lectura desalojadas por nodo de consulta debido a restricciones de tráfico.

Coordinador de datos

PanelDescripción del panelPromQL (lenguaje de consulta de Prometheus)Métricas Milvus utilizadasDescripción de las métricas Milvus
Número de nodos de datosNúmero de nodos de datos gestionados por data coord.sum(milvus_datacoord_datanode_num{app_kubernetes_io_instance=~"$instance", app_kubernetes_io_name="$app_name", namespace="$namespace"}) by (app_kubernetes_io_instance)milvus_datacoord_datanode_numNúmero de nodos de datos gestionados por data coord.
Número de segmentosNúmero de todos los tipos de segmentos registrados en los metadatos por el coordinador de datos.sum(milvus_datacoord_segment_num{app_kubernetes_io_instance=~"$instance", app_kubernetes_io_name="$app_name", namespace="$namespace"}) by (segment_state)milvus_datacoord_segment_numEl número de todos los tipos de segmentos registrados en metadatos por data coord.
Los tipos de segmento incluyen: abandonado, enjuagado, en crecimiento y sellado.
Número de coleccionesNúmero de colecciones registradas en los metadatos por coordenada de datos.sum(milvus_datacoord_collection_num{app_kubernetes_io_instance=~"$instance", app_kubernetes_io_name="$app_name", namespace="$namespace"}) by (app_kubernetes_io_instance)milvus_datacoord_collection_numNúmero de colecciones registradas en los metadatos por coordenada de datos.
Filas almacenadasNúmero acumulado de filas de datos válidos y vaciados en el código de datos.sum(milvus_datacoord_stored_rows_num{app_kubernetes_io_instance=~"$instance", app_kubernetes_io_name="$app_name", namespace="$namespace"}) by (app_kubernetes_io_instance)milvus_datacoord_stored_rows_numNúmero acumulado de filas de datos válidos y vaciados en la coordinación de datos.
Ritmo de filas almacenadasNúmero medio de filas vaciadas por segundo en los últimos dos minutos.sum(increase(milvus_datacoord_stored_rows_count{app_kubernetes_io_instance=~"$instance", app_kubernetes_io_name="$app_name", namespace="$namespace"}[2m])/120) by (pod, node_id)milvus_datacoord_stored_rows_countNúmero acumulado de filas vaciadas por coordenada de datos.
Tiempo de sincronizaciónEl número medio, máximo y mínimo de tiempo de época sincronizado por data coord en cada canal físico.avg(milvus_datacoord_sync_epoch_time{app_kubernetes_io_instance=~"$instance", app_kubernetes_io_name="$app_name", namespace="$namespace"}) by (app_kubernetes_io_instance) max(milvus_datacoord_sync_epoch_time{app_kubernetes_io_instance=~"$instance", app_kubernetes_io_name="$app_name", namespace="$namespace"}) by (app_kubernetes_io_instance) min(milvus_datacoord_sync_epoch_time{app_kubernetes_io_instance=~"$instance", app_kubernetes_io_name="$app_name", namespace="$namespace"}) by (app_kubernetes_io_instance)milvus_datacoord_sync_epoch_timeEl tiempo de época de cada canal físico (tiempo Unix, los milisegundos transcurridos desde el 1 de enero de 1970).
Tamaño del binlog almacenadoEl tamaño total del binlog almacenado.sum(milvus_datacoord_stored_binlog_size{app_kubernetes_io_instance=~"$instance", app_kubernetes_io_name="$app_name", namespace="$namespace"}) by (app_kubernetes_io_instance)milvus_datacoord_stored_binlog_sizeEl tamaño total del binlog almacenado en Milvus.

Nodo de datos

PanelDescripción del panelPromQL (Lenguaje de consulta de Prometheus)Las métricas Milvus utilizadasDescripción de las métricas Milvus
Número del diagrama de flujoEl número de objetos del diagrama de flujo que corresponden a cada nodo de datos.sum(milvus_datanode_flowgraph_num{app_kubernetes_io_instance=~"$instance", app_kubernetes_io_name="$app_name", namespace="$namespace"}) by (pod, node_id)milvus_datanode_flowgraph_numNúmero de objetos del diagrama de flujo.
Cada fragmento de una colección corresponde a un objeto del diagrama de flujo.
Tasa de consumo de filas de mensajesNúmero de filas de mensajes de flujo consumidas por segundo por cada nodo de datos en los últimos dos minutos.sum(increase(milvus_datanode_msg_rows_count{app_kubernetes_io_instance=~"$instance", app_kubernetes_io_name="$app_name", namespace="$namespace"}[2m])/120) by (msg_type, pod, node_id)milvus_datanode_msg_rows_countNúmero de filas de mensajes de flujo consumidos.
Actualmente, los mensajes de flujo contados por nodo de datos sólo incluyen mensajes de inserción y borrado.
Tasa de tamaño de datos de descargaEl tamaño de cada mensaje vaciado registrado por segundo por cada nodo de datos en los últimos dos minutos.sum(increase(milvus_datanode_flushed_data_size{app_kubernetes_io_instance=~"$instance", app_kubernetes_io_name="$app_name", namespace="$namespace"}[2m])/120) by (msg_type, pod, node_id)milvus_datanode_flushed_data_sizeEl tamaño de cada mensaje vaciado.
Actualmente, los mensajes de flujo contados por nodo de datos sólo incluyen mensajes de inserción y borrado.
Número de consumidoresNúmero de consumidores creados en cada nodo de datos.sum(milvus_datanode_consumer_num{app_kubernetes_io_instance=~"$instance", app_kubernetes_io_name="$app_name", namespace="$namespace"}) by (pod, node_id)milvus_datanode_consumer_numNúmero de consumidores creados en cada nodo de datos.
Cada diagrama de flujo corresponde a un consumidor.
Número de productoresNúmero de productores creados en cada nodo de datos.sum(milvus_datanode_producer_num{app_kubernetes_io_instance=~"$instance", app_kubernetes_io_name="$app_name", namespace="$namespace"}) by (pod, node_id)milvus_datanode_producer_numNúmero de consumidores creados en cada nodo de datos.
Cada fragmento de una colección corresponde a un productor de canal delta y a un productor de canal timetick.
Tiempo de sincronizaciónEl número medio, máximo y mínimo de tiempo de época sincronizado por cada nodo de datos en todos los temas físicos.avg(milvus_datanode_sync_epoch_time{app_kubernetes_io_instance=~"$instance", app_kubernetes_io_name="$app_name", namespace="$namespace"}) by (pod, node_id) max(milvus_datanode_sync_epoch_time{app_kubernetes_io_instance=~"$instance", app_kubernetes_io_name="$app_name", namespace="$namespace"}) by (pod, node_id) min(milvus_datanode_sync_epoch_time{app_kubernetes_io_instance=~"$instance", app_kubernetes_io_name="$app_name", namespace="$namespace"}) by (pod, node_id)milvus_datanode_sync_epoch_timeEl tiempo de época (tiempo Unix, los milisegundos transcurridos desde el 1 de enero de 1970.) de cada tema físico en un nodo de datos.
Número de segmentos no vaciadosEl número de segmentos no vaciados creados en cada nodo de datos.sum(milvus_datanode_unflushed_segment_num{app_kubernetes_io_instance=~"$instance", app_kubernetes_io_name="$app_name", namespace="$namespace"}) by (pod, node_id)milvus_datanode_unflushed_segment_numNúmero de segmentos no vaciados creados en cada nodo de datos.
Latencia del búfer de codificaciónLa latencia media y el percentil 99 del tiempo utilizado para codificar un búfer por cada nodo de datos en los últimos dos minutos.p99:
histogram_quantile(0.99, sum by (le, pod, node_id) (rate(milvus_datanode_encode_buffer_latency_bucket{app_kubernetes_io_instance=~"$instance", app_kubernetes_io_name="$app_name", namespace="$namespace"}[2m])))
avg:
sum(increase(milvus_datanode_encode_buffer_latency_sum{app_kubernetes_io_instance=~"$instance", app_kubernetes_io_name="$app_name", namespace="$namespace"}[2m])) by(pod, node_id) / sum(increase(milvus_datanode_encode_buffer_latency_count{app_kubernetes_io_instance=~"$instance", app_kubernetes_io_name="$app_name", namespace="$namespace"}[2m])) by(pod, node_id)
milvus_datanode_encode_buffer_latencyEl tiempo que tarda cada nodo de datos en codificar un búfer.
Latencia de almacenamiento de datosLa latencia media y el percentil 99 del tiempo utilizado para escribir un búfer en la capa de almacenamiento por cada nodo de datos en los últimos dos minutos.p99:
histogram_quantile(0.99, sum by (le, pod, node_id) (rate(milvus_datanode_save_latency_bucket{app_kubernetes_io_instance=~"$instance", app_kubernetes_io_name="$app_name", namespace="$namespace"}[2m])))
avg:
sum(increase(milvus_datanode_save_latency_sum{app_kubernetes_io_instance=~"$instance", app_kubernetes_io_name="$app_name", namespace="$namespace"}[2m])) by(pod, node_id) / sum(increase(milvus_datanode_save_latency_count{app_kubernetes_io_instance=~"$instance", app_kubernetes_io_name="$app_name", namespace="$namespace"}[2m])) by(pod, node_id)
milvus_datanode_save_latencyTiempo que tarda cada nodo de datos en escribir un búfer en la capa de almacenamiento.
Tasa de operaciones de descargaNúmero de veces que cada nodo de datos vacía un búfer por segundo en los últimos dos minutos.sum(increase(milvus_datanode_flush_buffer_op_count{app_kubernetes_io_instance=~"$instance", app_kubernetes_io_name="$app_name", namespace="$namespace"}[2m])/120) by (status, pod, node_id)milvus_datanode_flush_buffer_op_countNúmero acumulado de veces que un nodo de datos descarga un búfer.
Tasa de operación de descarga automáticaNúmero de veces que cada nodo de datos descarga automáticamente un búfer por segundo en los últimos dos minutos.sum(increase(milvus_datanode_autoflush_buffer_op_count{app_kubernetes_io_instance=~"$instance", app_kubernetes_io_name="$app_name", namespace="$namespace"}[2m])/120) by (status, pod, node_id)milvus_datanode_autoflush_buffer_op_countNúmero acumulado de veces que un nodo de datos descarga automáticamente un búfer.
Índice de solicitudes de descargaNúmero de veces que cada nodo de datos recibe una solicitud de vaciado de búfer por segundo en los últimos dos minutos.sum(increase(milvus_datanode_flush_req_count{app_kubernetes_io_instance=~"$instance", app_kubernetes_io_name="$app_name", namespace="$namespace"}[2m])/120) by (status, pod, node_id)milvus_datanode_flush_req_countNúmero acumulado de veces que un nodo de datos recibe una solicitud de vaciado de un búfer.
Latencia de compactaciónLa latencia media y el percentil 99 del tiempo que cada nodo de datos tarda en ejecutar una tarea de compactación en los últimos dos minutos.p99:
histogram_quantile(0.99, sum by (le, pod, node_id) (rate(milvus_datanode_compaction_latency_bucket{app_kubernetes_io_instance=~"$instance", app_kubernetes_io_name="$app_name", namespace="$namespace"}[2m])))
avg:
sum(increase(milvus_datanode_compaction_latency_sum{app_kubernetes_io_instance=~"$instance", app_kubernetes_io_name="$app_name", namespace="$namespace"}[2m])) by(pod, node_id) / sum(increase(milvus_datanode_compaction_latency_count{app_kubernetes_io_instance=~"$instance", app_kubernetes_io_name="$app_name", namespace="$namespace"}[2m])) by(pod, node_id)
milvus_datanode_compaction_latencyEl tiempo que tarda cada nodo de datos en ejecutar una tarea de compactación.

Índice coordinador

PanelDescripción del panelPromQL (lenguaje de consulta de Prometheus)Las métricas Milvus utilizadasDescripción de las métricas Milvus
Tasa de peticiones de índiceNúmero medio de solicitudes de creación de índices recibidas por segundo en los últimos dos minutos.sum(increase(milvus_indexcoord_indexreq_count{app_kubernetes_io_instance=~"$instance", app_kubernetes_io_name="$app_name", namespace="$namespace"}[2m])/120) by (status)milvus_indexcoord_indexreq_countNúmero de solicitudes de creación de índices recibidas.
Recuento de tareas de indexaciónRecuento de todas las tareas de indexación registradas en los metadatos del índice.sum(milvus_indexcoord_indextask_count{app_kubernetes_io_instance=~"$instance", app_kubernetes_io_name="$app_name", namespace="$namespace"}) by (index_task_status)milvus_indexcoord_indextask_countRecuento de todas las tareas de indexación registradas en los metadatos del índice.
Número de nodos de índiceNúmero de nodos de índice gestionados.sum(milvus_indexcoord_indexnode_num{app_kubernetes_io_instance=~"$instance", app_kubernetes_io_name="$app_name", namespace="$namespace"}) by (app_kubernetes_io_instance)milvus_indexcoord_indexnode_numNúmero de nodos de índice gestionados.

Nodo de índice

PanelDescripción del panelPromQL (lenguaje de consulta de Prometheus)Las métricas Milvus utilizadasDescripción de las métricas Milvus
Tasa de tareas de índiceNúmero medio de tareas de creación de índices recibidas por cada nodo de índice por segundo en los últimos dos minutos.sum(increase(milvus_indexnode_index_task_count{app_kubernetes_io_instance=~"$instance", app_kubernetes_io_name="$app_name", namespace="$namespace"}[2m])/120) by (status, pod, node_id)milvus_indexnode_index_task_countNúmero de tareas de creación de índices recibidas.
Latencia del campo de cargaLa latencia media y el percentil 99 del tiempo utilizado por cada nodo de índice para cargar datos de campo de segmento cada vez en los últimos dos minutos.p99:
histogram_quantile(0.99, sum by (le, pod, node_id) (rate(milvus_indexnode_load_field_latency_bucket{app_kubernetes_io_instance=~"$instance", app_kubernetes_io_name="$app_name", namespace="$namespace"}[2m])))
avg:
sum(increase(milvus_indexnode_load_field_latency_sum{app_kubernetes_io_instance=~"$instance", app_kubernetes_io_name="$app_name", namespace="$namespace"}[2m])) by(pod, node_id) / sum(increase(milvus_indexnode_load_field_latency_count{app_kubernetes_io_instance=~"$instance", app_kubernetes_io_name="$app_name", namespace="$namespace"}[2m])) by(pod, node_id)
milvus_indexnode_load_field_latencyEl tiempo utilizado por el nodo de índice para cargar los datos del campo de segmento.
Latencia del campo de descodificaciónLa latencia media y el percentil 99 del tiempo utilizado por cada nodo de índice para codificar datos de campo cada vez en los últimos dos minutos.p99:
histogram_quantile(0.99, sum by (le, pod, node_id) (rate(milvus_indexnode_decode_field_latency_bucket{app_kubernetes_io_instance=~"$instance", app_kubernetes_io_name="$app_name", namespace="$namespace"}[2m])))
avg:
sum(increase(milvus_indexnode_decode_field_latency_sum{app_kubernetes_io_instance=~"$instance", app_kubernetes_io_name="$app_name", namespace="$namespace"}[2m])) by(pod, node_id) / sum(increase(milvus_indexnode_decode_field_latency_count{app_kubernetes_io_instance=~"$instance", app_kubernetes_io_name="$app_name", namespace="$namespace"}[2m])) by(pod, node_id)
milvus_indexnode_decode_field_latencyEl tiempo utilizado para descodificar los datos de campo.
Latencia del índice de construcciónLa latencia media y el percentil 99 del tiempo utilizado por cada nodo de índice para construir índices en los últimos dos minutos.p99:
histogram_quantile(0.99, sum by (le, pod, node_id) (rate(milvus_indexnode_build_index_latency_bucket{app_kubernetes_io_instance=~"$instance", app_kubernetes_io_name="$app_name", namespace="$namespace"}[2m])))
avg:
sum(increase(milvus_indexnode_build_index_latency_sum{app_kubernetes_io_instance=~"$instance", app_kubernetes_io_name="$app_name", namespace="$namespace"}[2m])) by(pod, node_id) / sum(increase(milvus_indexnode_build_index_latency_count{app_kubernetes_io_instance=~"$instance", app_kubernetes_io_name="$app_name", namespace="$namespace"}[2m])) by(pod, node_id)
milvus_indexnode_build_index_latencyEl tiempo utilizado para construir índices.
Latencia del índice de codificaciónLa latencia media y el percentil 99 del tiempo utilizado por cada nodo de índice para codificar archivos de índice en los últimos dos minutos.p99:
histogram_quantile(0.99, sum by (le, pod, node_id) (rate(milvus_indexnode_encode_index_latency_bucket{app_kubernetes_io_instance=~"$instance", app_kubernetes_io_name="$app_name", namespace="$namespace"}[2m])))
avg:
sum(increase(milvus_indexnode_encode_index_latency_sum{app_kubernetes_io_instance=~"$instance", app_kubernetes_io_name="$app_name", namespace="$namespace"}[2m])) by(pod, node_id) / sum(increase(milvus_indexnode_encode_index_latency_count{app_kubernetes_io_instance=~"$instance", app_kubernetes_io_name="$app_name", namespace="$namespace"}[2m])) by(pod, node_id)
milvus_indexnode_encode_index_latencyEl tiempo utilizado para codificar archivos de índice.
Guardar latencia de índiceLa latencia media y el percentil 99 del tiempo utilizado por cada nodo de índice para guardar archivos de índice en los últimos dos minutos.p99:
histogram_quantile(0.99, sum by (le, pod, node_id) (rate(milvus_indexnode_save_index_latency_bucket{app_kubernetes_io_instance=~"$instance", app_kubernetes_io_name="$app_name", namespace="$namespace"}[2m])))
avg:
sum(increase(milvus_indexnode_save_index_latency_sum{app_kubernetes_io_instance=~"$instance", app_kubernetes_io_name="$app_name", namespace="$namespace"}[2m])) by(pod, node_id) / sum(increase(milvus_indexnode_save_index_latency_count{app_kubernetes_io_instance=~"$instance", app_kubernetes_io_name="$app_name", namespace="$namespace"}[2m])) by(pod, node_id)
milvus_indexnode_save_index_latencyEl tiempo utilizado para guardar archivos de índice.

Traducido porDeepL

Tabla de contenidos

Try Managed Milvus for Free

Zilliz Cloud is hassle-free, powered by Milvus and 10x faster.

Get Started
Feedback

¿Fue útil esta página?