Panel de métricas de Milvus
Milvus genera una lista de métricas detalladas de series temporales durante el tiempo de ejecución. Puede utilizar Prometheus y Grafana para visualizar las métricas. Este tema presenta las métricas de supervisión que se muestran en el panel de Milvus de Grafana.
La unidad de tiempo en este tema es milisegundos. Y "percentil 99" en este tema se refiere al hecho de que el 99 por ciento de las estadísticas de tiempo se controlan dentro de un cierto valor.
Recomendamos leer la descripción general del marco de supervisión de Milvus para comprender primero las métricas de Prometheus.
Proxy
Panel | Descripción del panel | PromQL (Lenguaje de consulta de Prometheus) | Las métricas Milvus utilizadas | Descripción de las métricas Milvus |
---|---|---|---|---|
Tasa de recuento de vectores de búsqueda | El número medio de vectores consultados por segundo por cada proxy en los últimos dos minutos. | sum(increase(milvus_proxy_search_vectors_count{app_kubernetes_io_instance=~"$instance", app_kubernetes_io_name="$app_name", namespace="$namespace"}[2m])/120) by (pod, node_id) | milvus_proxy_search_vectors_count | Número acumulado de vectores consultados. |
Índice de recuento de vectores insertados | Número medio de vectores insertados por segundo por cada proxy en los últimos dos minutos. | sum(increase(milvus_proxy_insert_vectors_count{app_kubernetes_io_instance=~"$instance", app_kubernetes_io_name="$app_name", namespace="$namespace"}[2m])/120) by (pod, node_id) | milvus_proxy_insert_vectors_count | Número acumulado de vectores insertados. |
Latencia de búsqueda | La latencia media y el percentil 99 de la latencia de recepción de solicitudes de búsqueda y consulta por cada proxy en los últimos dos minutos. | p99: histogram_quantile(0.99, sum by (le, query_type, pod, node_id) (rate(milvus_proxy_sq_latency_bucket{app_kubernetes_io_instance=~"$instance", app_kubernetes_io_name="$app_name", namespace="$namespace"}[2m]))) avg: sum(increase(milvus_proxy_sq_latency_sum{app_kubernetes_io_instance=~"$instance", app_kubernetes_io_name="$app_name", namespace="$namespace"}[2m])) by (pod, node_id, query_type) / sum(increase(milvus_proxy_sq_latency_count{app_kubernetes_io_instance=~"$instance", app_kubernetes_io_name="$app_name", namespace="$namespace"}[2m])) by (pod, node_id, query_type) | milvus_proxy_sq_latency | Latencia de las solicitudes de búsqueda y consulta. |
Latencia de búsqueda de colecciones | La latencia media y el percentil 99 de la latencia de recepción de solicitudes de búsqueda y consulta de una colección específica por cada proxy en los últimos dos minutos. | p99: histogram_quantile(0.99, sum by (le, query_type, pod, node_id) (rate(milvus_proxy_collection_sq_latency_bucket{app_kubernetes_io_instance=~"$instance", app_kubernetes_io_name="$app_name", namespace="$namespace", collection_name=~"$collection"}[2m]))) avg: sum(increase(milvus_proxy_collection_sq_latency_sum{app_kubernetes_io_instance=~"$instance", app_kubernetes_io_name="$app_name", namespace="$namespace", collection_name=~"$collection"}[2m])) by (pod, node_id, query_type) / sum(increase(milvus_proxy_collection_sq_latency_count{app_kubernetes_io_instance=~"$instance", app_kubernetes_io_name="$app_name", namespace="$namespace", collection_name=~"$collection"}[2m])) by (pod, node_id, query_type) | milvus_proxy_collection_sq_latency_sum | Latencia de las solicitudes de búsqueda y consulta a una colección específica |
Latencia de mutación | La latencia media y el percentil 99 de la latencia de recepción de solicitudes de mutación por cada proxy en los últimos dos minutos. | p99: histogram_quantile(0.99, sum by (le, msg_type, pod, node_id) (rate(milvus_proxy_mutation_latency_bucket{app_kubernetes_io_instance=~"$instance", app_kubernetes_io_name="$app_name", namespace="$namespace"}[2m]))) avg: sum(increase(milvus_proxy_mutation_latency_sum{app_kubernetes_io_instance=~"$instance", app_kubernetes_io_name="$app_name", namespace="$namespace"}[2m])) by (pod, node_id, msg_type) / sum(increase(milvus_proxy_mutation_latency_count{app_kubernetes_io_instance=~"$instance", app_kubernetes_io_name="$app_name", namespace="$namespace"}[2m])) by (pod, node_id, msg_type) | milvus_proxy_mutation_latency_sum | Latencia de las solicitudes de mutación. |
Latencia de mutación de la colección | La latencia media y el percentil 99 de la latencia de recepción de solicitudes de mutación a una colección específica por cada proxy en los últimos dos minutos. | p99: histogram_quantile(0.99, sum by (le, query_type, pod, node_id) (rate(milvus_proxy_collection_sq_latency_bucket{app_kubernetes_io_instance=~"$instance", app_kubernetes_io_name="$app_name", namespace="$namespace", collection_name=~"$collection"}[2m]))) avg: sum(increase(milvus_proxy_collection_sq_latency_sum{app_kubernetes_io_instance=~"$instance", app_kubernetes_io_name="$app_name", namespace="$namespace", collection_name=~"$collection"}[2m])) by (pod, node_id, query_type) / sum(increase(milvus_proxy_collection_sq_latency_count{app_kubernetes_io_instance=~"$instance", app_kubernetes_io_name="$app_name", namespace="$namespace", collection_name=~"$collection"}[2m])) by (pod, node_id, query_type) | milvus_proxy_collection_sq_latency_sum | Latencia de las solicitudes de mutación a una colección específica |
Latencia de los resultados de búsqueda en espera | La latencia media y el percentil 99 de la latencia entre el envío de solicitudes de búsqueda y consulta y la recepción de resultados por proxy en los últimos dos minutos. | p99: histogram_quantile(0.99, sum by (le, query_type, pod, node_id) (rate(milvus_proxy_sq_wait_result_latency_bucket{app_kubernetes_io_instance=~"$instance", app_kubernetes_io_name="$app_name", namespace="$namespace"}[2m]))) avg: sum(increase(milvus_proxy_sq_wait_result_latency_sum{app_kubernetes_io_instance=~"$instance", app_kubernetes_io_name="$app_name", namespace="$namespace"}[2m])) by (pod, node_id, query_type) / sum(increase(milvus_proxy_sq_wait_result_latency_count{app_kubernetes_io_instance=~"$instance", app_kubernetes_io_name="$app_name", namespace="$namespace"}[2m])) by (pod, node_id, query_type) | milvus_proxy_sq_wait_result_latency | Latencia entre el envío de solicitudes de búsqueda y consulta y la recepción de resultados. |
Reducir la latencia de los resultados de búsqueda | La latencia media y el percentil 99 de la latencia de agregación de resultados de búsqueda y consulta por proxy en los últimos dos minutos. | p99: histogram_quantile(0.99, sum by (le, query_type, pod, node_id) (rate(milvus_proxy_sq_reduce_result_latency_bucket{app_kubernetes_io_instance=~"$instance", app_kubernetes_io_name="$app_name", namespace="$namespace"}[2m]))) avg: sum(increase(milvus_proxy_sq_reduce_result_latency_sum{app_kubernetes_io_instance=~"$instance", app_kubernetes_io_name="$app_name", namespace="$namespace"}[2m])) by (pod, node_id, query_type) / sum(increase(milvus_proxy_sq_reduce_result_latency_count{app_kubernetes_io_instance=~"$instance", app_kubernetes_io_name="$app_name", namespace="$namespace"}[2m])) by (pod, node_id, query_type) | milvus_proxy_sq_reduce_result_latency | Latencia de la agregación de resultados de búsqueda y consulta devueltos por cada nodo de consulta. |
Latencia de decodificación de resultados de búsqueda | La latencia media y el percentil 99 de la latencia de decodificación de resultados de búsqueda y consulta por proxy en los últimos dos minutos. | p99: histogram_quantile(0.99, sum by (le, query_type, pod, node_id) (rate(milvus_proxy_sq_decode_result_latency_bucket{app_kubernetes_io_instance=~"$instance", app_kubernetes_io_name="$app_name", namespace="$namespace"}[2m]))) avg: sum(increase(milvus_proxy_sq_decode_result_latency_sum{app_kubernetes_io_instance=~"$instance", app_kubernetes_io_name="$app_name", namespace="$namespace"}[2m])) by (pod, node_id, query_type) / sum(increase(milvus_proxy_sq_decode_resultlatency_count{app_kubernetes_io_instance=~"$instance", app_kubernetes_io_name="$app_name", namespace="$namespace"}[2m])) by (pod, node_id, query_type) | milvus_proxy_sq_decode_result_latency | Latencia de descodificación de cada resultado de búsqueda y consulta. |
Msg Stream Object Num | El número medio, máximo y mínimo de objetos msgstream creados por cada proxy en su tema físico correspondiente en los últimos dos minutos. | avg(milvus_proxy_msgstream_obj_num{app_kubernetes_io_instance=~"$instance", app_kubernetes_io_name="$app_name", namespace="$namespace"}) by (pod, node_id) max(milvus_proxy_msgstream_obj_num{app_kubernetes_io_instance=~"$instance", app_kubernetes_io_name="$app_name", namespace="$namespace"}) by (pod, node_id) min(milvus_proxy_msgstream_obj_num{app_kubernetes_io_instance=~"$instance", app_kubernetes_io_name="$app_name", namespace="$namespace"}) by (pod, node_id) | milvus_proxy_msgstream_obj_num | El número de objetos msgstream creados en cada tema físico. |
Latencia de envío de mutaciones | La latencia media y el percentil 99 de la latencia de envío de solicitudes de inserción o eliminación por cada proxy en los últimos dos minutos. | p99: histogram_quantile(0.99, sum by (le, msg_type, pod, node_id) (rate(milvus_proxy_mutation_send_latency_bucket{app_kubernetes_io_instance=~"$instance", app_kubernetes_io_name="$app_name", namespace="$namespace"}[2m]))) avg: sum(increase(milvus_proxy_mutation_send_latency_sum{app_kubernetes_io_instance=~"$instance", app_kubernetes_io_name="$app_name", namespace="$namespace"}[2m])) by (pod, node_id, msg_type) / sum(increase(milvus_proxy_mutation_send_latency_count{app_kubernetes_io_instance=~"$instance", app_kubernetes_io_name="$app_name", namespace="$namespace"}[2m])) by (pod, node_id, msg_type) | milvus_proxy_mutation_send_latency | Latencia de envío de solicitudes de inserción o borrado. |
Índice de aciertos de caché | La tasa media de aciertos en caché de las operaciones que incluyen GeCollectionID , GetCollectionInfo , y GetCollectionSchema por segundo en los últimos dos minutos. | sum(increase(milvus_proxy_cache_hit_count{app_kubernetes_io_instance=~"$instance", app_kubernetes_io_name="$app_name", namespace="$namespace", cache_state="hit"}[2m])/120) by(cache_name, pod, node_id) / sum(increase(milvus_proxy_cache_hit_count{app_kubernetes_io_instance=~"$instance", app_kubernetes_io_name="$app_name", namespace="$namespace"}[2m])/120) by(cache_name, pod, node_id) | milvus_proxy_cache_hit_count | Las estadísticas de aciertos y fallos de cada operación de lectura de la caché. |
Latencia de actualización de la caché | La latencia media y el percentil 99 de la latencia de actualización de la caché por proxy en los últimos dos minutos. | p99: histogram_quantile(0.99, sum by (le, pod, node_id) (rate(milvus_proxy_cache_update_latency_bucket{app_kubernetes_io_instance=~"$instance", app_kubernetes_io_name="$app_name", namespace="$namespace"}[2m]))) avg: sum(increase(milvus_proxy_cache_update_latency_sum{app_kubernetes_io_instance=~"$instance", app_kubernetes_io_name="$app_name", namespace="$namespace"}[2m])) by (pod, node_id) / sum(increase(milvus_proxy_cache_update_latency_count{app_kubernetes_io_instance=~"$instance", app_kubernetes_io_name="$app_name", namespace="$namespace"}[2m])) by (pod, node_id) | milvus_proxy_cache_update_latency | La latencia de actualización de la caché cada vez. |
Tiempo de sincronización | El número medio, máximo y mínimo de tiempo de época sincronizado por cada proxy en su canal físico correspondiente. | avg(milvus_proxy_sync_epoch_time{app_kubernetes_io_instance=~"$instance", app_kubernetes_io_name="$app_name", namespace="$namespace"}) by (pod, node_id) max(milvus_proxy_sync_epoch_time{app_kubernetes_io_instance=~"$instance", app_kubernetes_io_name="$app_name", namespace="$namespace"}) by (pod, node_id) min(milvus_proxy_sync_epoch_time{app_kubernetes_io_instance=~"$instance", app_kubernetes_io_name="$app_name", namespace="$namespace"}) by (pod, node_id) | milvus_proxy_sync_epoch_time | El tiempo de época de cada canal físico (tiempo Unix, los milisegundos transcurridos desde el 1 de enero de 1970). Existe un ChannelName por defecto aparte de los canales físicos. |
Aplicar latencia PK | La latencia media y el percentil 99 de la latencia de aplicación de clave primaria por cada proxy en los últimos dos minutos. | p99: histogram_quantile(0.99, sum by (le, pod, node_id) (rate(milvus_proxy_apply_pk_latency_bucket{app_kubernetes_io_instance=~"$instance", app_kubernetes_io_name="$app_name", namespace="$namespace"}[2m]))) avg: sum(increase(milvus_proxy_apply_pk_latency_sum{app_kubernetes_io_instance=~"$instance", app_kubernetes_io_name="$app_name", namespace="$namespace"}[2m])) by (pod, node_id) / sum(increase(milvus_proxy_apply_pk_latency_count{app_kubernetes_io_instance=~"$instance", app_kubernetes_io_name="$app_name", namespace="$namespace"}[2m])) by (pod, node_id) | milvus_proxy_apply_pk_latency | La latencia de aplicación de clave primaria. |
Latencia de aplicación de marca de tiempo | La latencia media y el percentil 99 de la latencia de aplicación de marca de hora por cada proxy en los últimos dos minutos. | p99: histogram_quantile(0.99, sum by (le, pod, node_id) (rate(milvus_proxy_apply_timestamp_latency_bucket{app_kubernetes_io_instance=~"$instance", app_kubernetes_io_name="$app_name", namespace="$namespace"}[2m]))) avg: sum(increase(milvus_proxy_apply_timestamp_latency_sum{app_kubernetes_io_instance=~"$instance", app_kubernetes_io_name="$app_name", namespace="$namespace"}[2m])) by (pod, node_id) / sum(increase(milvus_proxy_apply_timestamp_latency_count{app_kubernetes_io_instance=~"$instance", app_kubernetes_io_name="$app_name", namespace="$namespace"}[2m])) by (pod, node_id) | milvus_proxy_apply_timestamp_latency | Latencia de aplicación de la marca de tiempo. |
Tasa de éxito de solicitudes | El número de solicitudes recibidas con éxito por segundo por cada proxy, con un desglose detallado de cada tipo de solicitud. Los posibles tipos de solicitud son DescribeCollection, DescribeIndex, GetCollectionStatistics, HasCollection, Search, Query, ShowPartitions, Insert, etc. | |||
sum(increase(milvus_proxy_req_count{app_kubernetes_io_instance=~"$instance", app_kubernetes_io_name="$app_name", namespace="$namespace", status="success"}[2m])/120) by(function_name, pod, node_id) | milvus_proxy_req_count | El número de todos los tipos de solicitudes recibidas | ||
Tasa de solicitudes fallidas | El número de peticiones fallidas recibidas por segundo por cada proxy, con un desglose detallado de cada tipo de petición. Los posibles tipos de solicitud son DescribeCollection, DescribeIndex, GetCollectionStatistics, HasCollection, Search, Query, ShowPartitions, Insert, etc. | |||
sum(increase(milvus_proxy_req_count{app_kubernetes_io_instance=~"$instance", app_kubernetes_io_name="$app_name", namespace="$namespace", status="fail"}[2m])/120) by(function_name, pod, node_id) | milvus_proxy_req_count | El número de todos los tipos de peticiones recibidas | ||
Latencia de la solicitud | La latencia media y el percentil 99 de la latencia de todos los tipos de recepción de solicitudes por cada proxy | p99: histogram_quantile(0.99, sum by (le, pod, node_id, function_name) (rate(milvus_proxy_req_latency_bucket{app_kubernetes_io_instance=~"$instance", app_kubernetes_io_name="$app_name", namespace="$namespace"}[2m]))) avg: sum(increase(milvus_proxy_req_latency_sum{app_kubernetes_io_instance=~"$instance", app_kubernetes_io_name="$app_name", namespace="$namespace"}[2m])) by (pod, node_id, function_name) / sum(increase(milvus_proxy_req_latency_count{app_kubernetes_io_instance=~"$instance", app_kubernetes_io_name="$app_name", namespace="$namespace"}[2m])) by (pod, node_id, function_name) | milvus_proxy_req_latency | Latencia de todos los tipos de recepción de solicitudes |
Tasa de bytes de solicitudes de inserción/borrado | El número de bytes de solicitudes de inserción y borrado recibidas por segundo por el proxy en los últimos dos minutos. | sum(increase(milvus_proxy_receive_bytes_count{app_kubernetes_io_instance=~"$instance", app_kubernetes_io_name="$app_name", namespace="$namespace"}[2m])/120) by(pod, node_id) | milvus_proxy_receive_bytes_count | El recuento de peticiones de inserción y borrado. |
Tasa de bytes enviados | El número de bytes por segundo enviados de vuelta al cliente mientras cada proxy está respondiendo a peticiones de búsqueda y consulta en los últimos dos minutos. | sum(increase(milvus_proxy_send_bytes_count{app_kubernetes_io_instance=~"$instance", app_kubernetes_io_name="$app_name", namespace="$namespace"}[2m])/120) by(pod, node_id) | milvus_proxy_send_bytes_count | Número de bytes devueltos al cliente mientras cada proxy responde a solicitudes de búsqueda y consulta. |
Coordinador raíz
Panel | Descripción del panel | PromQL (lenguaje de consulta de Prometheus) | Las métricas Milvus utilizadas | Descripción de las métricas Milvus |
---|---|---|---|---|
Número de nodo proxy | El número de proxies creados. | sum(milvus_rootcoord_proxy_num{app_kubernetes_io_instance=~"$instance", app_kubernetes_io_name="$app_name", namespace="$namespace"}) by (app_kubernetes_io_instance) | milvus_rootcoord_proxy_num | El número de proxies. |
Tiempo de sincronización | El número medio, máximo y mínimo de tiempo de época sincronizado por cada coordenada raíz en cada canal físico (PChannel). | avg(milvus_rootcoord_sync_epoch_time{app_kubernetes_io_instance=~"$instance", app_kubernetes_io_name="$app_name", namespace="$namespace"}) by (app_kubernetes_io_instance) max(milvus_rootcoord_sync_epoch_time{app_kubernetes_io_instance=~"$instance", app_kubernetes_io_name="$app_name", namespace="$namespace"}) by (app_kubernetes_io_instance) min(milvus_rootcoord_sync_epoch_time{app_kubernetes_io_instance=~"$instance", app_kubernetes_io_name="$app_name", namespace="$namespace"}) by (app_kubernetes_io_instance) | milvus_rootcoord_sync_epoch_time | El tiempo de época de cada canal físico (tiempo Unix, los milisegundos transcurridos desde el 1 de enero de 1970). |
Tasa de peticiones DDL | El estado y número de peticiones DDL por segundo en los últimos dos minutos. | sum(increase(milvus_rootcoord_ddl_req_count{app_kubernetes_io_instance=~"$instance", app_kubernetes_io_name="$app_name", namespace="$namespace"}[2m])/120) by (status, function_name) | milvus_rootcoord_ddl_req_count | El número total de peticiones DDL incluyendo CreateCollection , DescribeCollection , DescribeSegments , HasCollection , ShowCollections , ShowPartitions , y ShowSegments . |
Latencia de las peticiones DDL | La latencia media y el percentil 99 de la latencia de peticiones DDL en los últimos dos minutos. | p99: histogram_quantile(0.99, sum by (le, function_name) (rate(milvus_rootcoord_ddl_req_latency_bucket{app_kubernetes_io_instance=~"$instance", app_kubernetes_io_name="$app_name", namespace="$namespace"}[2m]))) avg: sum(increase(milvus_rootcoord_ddl_req_latency_sum{app_kubernetes_io_instance=~"$instance", app_kubernetes_io_name="$app_name", namespace="$namespace"}[2m])) by (function_name) / sum(increase(milvus_rootcoord_ddl_req_latency_count{app_kubernetes_io_instance=~"$instance", app_kubernetes_io_name="$app_name", namespace="$namespace"}[2m])) by (function_name) | milvus_rootcoord_ddl_req_latency | La latencia de todos los tipos de peticiones DDL. |
Latencia de cronología de sincronización | La latencia media y el percentil 99 del tiempo utilizado por root coord para sincronizar todas las marcas de tiempo con PChannel en los últimos dos minutos. | p99: histogram_quantile(0.99, sum by (le) (rate(milvus_rootcoord_sync_timetick_latency_bucket{app_kubernetes_io_instance=~"$instance", app_kubernetes_io_name="$app_name", namespace="$namespace"}[2m]))) avg: sum(increase(milvus_rootcoord_sync_timetick_latency_sum{app_kubernetes_io_instance=~"$instance", app_kubernetes_io_name="$app_name", namespace="$namespace"}[2m])) / sum(increase(milvus_rootcoord_sync_timetick_latency_count{app_kubernetes_io_instance=~"$instance", app_kubernetes_io_name="$app_name", namespace="$namespace"}[2m])) | milvus_rootcoord_sync_timetick_latency | el tiempo utilizado por el coordenador raíz para sincronizar todas las marcas de tiempo con pchannel. |
Tasa de asignación de ID | Número de ID asignados por root coord por segundo en los últimos dos minutos. | sum(increase(milvus_rootcoord_id_alloc_count{app_kubernetes_io_instance=~"$instance", app_kubernetes_io_name="$app_name", namespace="$namespace"}[2m])/120) | milvus_rootcoord_id_alloc_count | El número acumulado de IDs asignados por root coord. |
Marca de tiempo | Fecha y hora más recientes de root coord. | milvus_rootcoord_timestamp{app_kubernetes_io_instance=~"$instance", app_kubernetes_io_name="$app_name", namespace="$namespace"} | milvus_rootcoord_timestamp | Fecha y hora más recientes de root coord. |
Marca de hora guardada | Las marcas de tiempo preasignadas que root coord guarda en metaalmacenamiento. | milvus_rootcoord_timestamp_saved{app_kubernetes_io_instance=~"$instance", app_kubernetes_io_name="$app_name", namespace="$namespace"} | milvus_rootcoord_timestamp_saved | Las marcas de tiempo preasignadas que root coord guarda en metaalmacenamiento. Las marcas de tiempo se asignan 3 segundos antes. Y la marca de tiempo se actualiza y guarda en meta almacenamiento cada 50 milisegundos. |
Número de colecciones | El número total de colecciones. | sum(milvus_rootcoord_collection_num{app_kubernetes_io_instance=~"$instance", app_kubernetes_io_name="$app_name", namespace="$namespace"}) by (app_kubernetes_io_instance) | milvus_rootcoord_collection_num | El número total de colecciones existentes en Milvus actualmente. |
Número de particiones | El número total de particiones. | sum(milvus_rootcoord_partition_num{app_kubernetes_io_instance=~"$instance", app_kubernetes_io_name="$app_name", namespace="$namespace"}) by (app_kubernetes_io_instance) | milvus_rootcoord_partition_num | El número total de particiones existentes en Milvus actualmente. |
Número de canales DML | El número total de canales DML. | sum(milvus_rootcoord_dml_channel_num{app_kubernetes_io_instance=~"$instance", app_kubernetes_io_name="$app_name", namespace="$namespace"}) by (app_kubernetes_io_instance) | milvus_rootcoord_dml_channel_num | El número total de canales DML existentes en Milvus actualmente. |
Número de Msgstream | El número total de msgstreams. | sum(milvus_rootcoord_msgstream_obj_num{app_kubernetes_io_instance=~"$instance", app_kubernetes_io_name="$app_name", namespace="$namespace"}) by (app_kubernetes_io_instance) | milvus_rootcoord_msgstream_obj_num | El número total de msgstreams existentes en Milvus actualmente. |
Número de credenciales | El número total de credenciales. | sum(milvus_rootcoord_credential_num{app_kubernetes_io_instance=~"$instance", app_kubernetes_io_name="$app_name", namespace="$namespace"}) by (app_kubernetes_io_instance) | milvus_rootcoord_credential_num | El número total de credenciales en Milvus actualmente. |
Tiempo de retardo | La suma del tiempo máximo de retardo de los gráficos de flujo en todos los DataNodes y QueryNodes. | sum(milvus_rootcoord_time_tick_delay{app_kubernetes_io_instance=~"$instance", app_kubernetes_io_name="$app_name", namespace="$namespace"}) by (app_kubernetes_io_instance) | milvus_rootcoord_time_tick_delay | El tiempo máximo de retardo de los gráficos de flujo en cada DataNode y QueryNode. |
Coordinador de consultas
Panel | Descripción del panel | PromQL (lenguaje de consulta de Prometheus) | Las métricas Milvus utilizadas | Descripción de las métricas de Milvus |
---|---|---|---|---|
Número de colecciones cargadas | El número de colecciones que están actualmente cargadas en memoria. | sum(milvus_querycoord_collection_num{app_kubernetes_io_instance=~"$instance", app_kubernetes_io_name="$app_name", namespace="$namespace"}) by (app_kubernetes_io_instance) | milvus_querycoord_collection_num | El número de colecciones cargadas actualmente por Milvus. |
Número de entidades cargadas | Número de entidades cargadas actualmente en memoria. | sum(milvus_querycoord_entity_num{app_kubernetes_io_instance=~"$instance", app_kubernetes_io_name="$app_name", namespace="$namespace"}) by (app_kubernetes_io_instance) | milvus_querycoord_entitiy_num | El número de entidades cargadas actualmente por Milvus. |
Tasa de solicitudes de carga | Número de solicitudes de carga por segundo en los últimos dos minutos. | sum(increase(milvus_querycoord_load_req_count{app_kubernetes_io_instance=~"$instance", app_kubernetes_io_name="$app_name", namespace="$namespace"}[2m])120) by (status) | milvus_querycoord_load_req_count | El número acumulado de peticiones de carga. |
Tasa de solicitudes de liberación | Número de solicitudes de liberación por segundo en los últimos dos minutos. | sum(increase(milvus_querycoord_release_req_count{app_kubernetes_io_instance=~"$instance", app_kubernetes_io_name="$app_name", namespace="$namespace"}[2m])/120) by (status) | milvus_querycoord_release_req_count | Número acumulado de solicitudes de liberación. |
Latencia de las solicitudes de carga | La latencia media y el percentil 99 de latencia de solicitudes de carga en los últimos dos minutos. | p99: histogram_quantile(0.99, sum by (le) (rate(milvus_querycoord_load_latency_bucket{app_kubernetes_io_instance=~"$instance", app_kubernetes_io_name="$app_name", namespace="$namespace"}[2m]))) avg: sum(increase(milvus_querycoord_load_latency_sum{app_kubernetes_io_instance=~"$instance", app_kubernetes_io_name="$app_name", namespace="$namespace"}[2m])) / sum(increase(milvus_querycoord_load_latency_count{app_kubernetes_io_instance=~"$instance", app_kubernetes_io_name="$app_name", namespace="$namespace"}[2m])) | milvus_querycoord_load_latency | El tiempo utilizado para completar una solicitud de carga. |
Latencia de solicitud de liberación | La latencia media y el percentil 99 de latencia de solicitud de liberación en los últimos dos minutos. | p99: histogram_quantile(0.99, sum by (le) (rate(milvus_querycoord_release_latency_bucket{app_kubernetes_io_instance=~"$instance", app_kubernetes_io_name="$app_name", namespace="$namespace"}[2m]))) avg: sum(increase(milvus_querycoord_release_latency_sum{app_kubernetes_io_instance=~"$instance", app_kubernetes_io_name="$app_name", namespace="$namespace"}[2m])) / sum(increase(milvus_querycoord_release_latency_count{app_kubernetes_io_instance=~"$instance", app_kubernetes_io_name="$app_name", namespace="$namespace"}[2m])) | milvus_querycoord_release_latency | El tiempo utilizado para completar una solicitud de liberación. |
Tarea de subcarga | El número de tareas de subcarga. | sum(milvus_querycoord_child_task_num{app_kubernetes_io_instance=~"$instance", app_kubernetes_io_name="$app_name", namespace="$namespace"}) by (app_kubernetes_io_instance) | milvus_querycoord_child_task_num | El número de subtareas de carga. Una coordenada de consulta divide una solicitud de carga en varias subtareas de carga. |
Tarea de carga principal | Número de tareas de carga principales. | sum(milvus_querycoord_parent_task_num{app_kubernetes_io_instance=~"$instance", app_kubernetes_io_name="$app_name", namespace="$namespace"}) by (app_kubernetes_io_instance) | milvus_querycoord_parent_task_num | Número de subtareas de carga. Cada solicitud de carga corresponde a una tarea padre en la cola de tareas. |
Latencia de la subtarea de carga | La latencia media y el percentil 99 de la latencia de una tarea de subcarga en los últimos dos minutos. | p99: histogram_quantile(0.99, sum by (le) (rate(milvus_querycoord_child_task_latency_bucket{app_kubernetes_io_instance=~"$instance", app_kubernetes_io_name="$app_name", namespace="$namespace"}[2m]))) avg: sum(increase(milvus_querycoord_child_task_latency_sum{app_kubernetes_io_instance=~"$instance", app_kubernetes_io_name="$app_name", namespace="$namespace"}[2m])) / sum(increase(milvus_querycoord_child_task_latency_count{app_kubernetes_io_instance=~"$instance", app_kubernetes_io_name="$app_name", namespace="$namespace"}[2m])) namespace"}[2m]))) | milvus_querycoord_child_task_latency | La latencia para completar una tarea de subcarga. |
Número de nodos de consulta | Número de nodos de consulta gestionados por el coordinador de consultas. | sum(milvus_querycoord_querynode_num{app_kubernetes_io_instance=~"$instance", app_kubernetes_io_name="$app_name", namespace="$namespace"}) by (app_kubernetes_io_instance) | milvus_querycoord_querynode_num | Número de nodos de consulta gestionados por query coord. |
Nodo de consulta
Panel | Descripción del panel | PromQL (lenguaje de consulta de Prometheus) | Las métricas Milvus utilizadas | Descripción de las métricas de Milvus |
---|---|---|---|---|
Número de colecciones cargadas | El número de colecciones cargadas en memoria por cada nodo de consulta. | sum(milvus_querynode_collection_num{app_kubernetes_io_instance=~"$instance", app_kubernetes_io_name="$app_name", namespace="$namespace"}) by (pod, node_id) | milvus_querynode_collection_num | Número de colecciones cargadas por cada nodo de consulta. |
Número de particiones cargadas | Número de particiones cargadas en memoria por cada nodo de consulta. | sum(milvus_querynode_partition_num{app_kubernetes_io_instance=~"$instance", app_kubernetes_io_name="$app_name", namespace="$namespace"}) by (pod, node_id) | milvus_querynode_partition_num | El número de particiones cargadas por cada nodo de consulta. |
Número de segmentos cargados | El número de segmentos cargados en memoria por cada nodo de consulta. | sum(milvus_querynode_segment_num{app_kubernetes_io_instance=~"$instance", app_kubernetes_io_name="$app_name", namespace="$namespace"}) by (pod, node_id) | milvus_querynode_segment_num | El número de segmentos cargados por cada nodo de consulta. |
Número de entidades consultables | Número de entidades consultables y buscables en cada nodo de consulta. | sum(milvus_querynode_entity_num{app_kubernetes_io_instance=~"$instance", app_kubernetes_io_name="$app_name", namespace="$namespace"}) by (pod, node_id) | milvus_querynode_entity_num | El número de entidades consultables y buscables en cada nodo de consulta. |
Canal virtual DML | Número de canales virtuales DML observados por cada nodo de consulta. | sum(milvus_querynode_dml_vchannel_num{app_kubernetes_io_instance=~"$instance", app_kubernetes_io_name="$app_name", namespace="$namespace"}) by (pod, node_id) | milvus_querynode_dml_vchannel_num | Número de canales virtuales DML observados por cada nodo de consulta. |
Canal virtual delta | Número de canales delta observados por cada nodo de consulta. | sum(milvus_querynode_delta_vchannel_num{app_kubernetes_io_instance=~"$instance", app_kubernetes_io_name="$app_name", namespace="$namespace"}) by (pod, node_id) | milvus_querynode_delta_vchannel_num | Número de canales delta observados por cada nodo de consulta. |
Número de consumidores | Número de consumidores en cada nodo de consulta. | sum(milvus_querynode_consumer_num{app_kubernetes_io_instance=~"$instance", app_kubernetes_io_name="$app_name", namespace="$namespace"}) by (pod, node_id) | milvus_querynode_consumer_num | Número de consumidores en cada nodo de consulta. |
Tasa de solicitudes de búsqueda | El número total de solicitudes de búsqueda y consulta recibidas por segundo por cada nodo de consulta y el número de solicitudes de búsqueda y consulta realizadas con éxito en los últimos dos minutos. | sum(increase(milvus_querynode_sq_req_count{app_kubernetes_io_instance=~"$instance", app_kubernetes_io_name="$app_name", namespace="$namespace"}[2m])/120) by (query_type, status, pod, node_id) | milvus_querynode_sq_req_count | Número acumulado de peticiones de búsqueda y consulta. |
Latencia de las solicitudes de búsqueda | La latencia media y el percentil 99 del tiempo utilizado en las peticiones de búsqueda y consulta por cada nodo de consulta en los últimos dos minutos. Este panel muestra la latencia de las peticiones de búsqueda y consulta cuyo estado es "éxito" o "total". | p99: histogram_quantile(0.99, sum by (le, pod, node_id) (rate(milvus_querynode_sq_req_latency_bucket{app_kubernetes_io_instance=~"$instance", app_kubernetes_io_name="$app_name", namespace="$namespace"}[2m]))) avg: sum(increase(milvus_querynode_sq_req_latency_sum{app_kubernetes_io_instance=~"$instance", app_kubernetes_io_name="$app_name", namespace="$namespace"}[2m])) by(pod, node_id, query_type) / sum(increase(milvus_querynode_sq_req_latency_count{app_kubernetes_io_instance=~"$instance", app_kubernetes_io_name="$app_name", namespace="$namespace"}[2m])) by(pod, node_id, query_type) | milvus_querynode_sq_req_latency | La latencia de las peticiones de búsqueda del nodo de consulta. |
Latencia de búsqueda en cola | La latencia media y el percentil 99 de la latencia de las solicitudes de búsqueda y consulta en cola en los últimos dos minutos. | p99: histogram_quantile(0.99, sum by (le, pod, node_id, query_type) (rate(milvus_querynode_sq_queue_latency_bucket{app_kubernetes_io_instance=~"$instance", app_kubernetes_io_name="$app_name", namespace="$namespace"}[2m]))) avg: sum(increase(milvus_querynode_sq_queue_latency_sum{app_kubernetes_io_instance=~"$instance", app_kubernetes_io_name="$app_name", namespace="$namespace"}[2m])) by(pod, node_id, query_type) / sum(increase(milvus_querynode_sq_queue_latency_count{app_kubernetes_io_instance=~"$instance", app_kubernetes_io_name="$app_name", namespace="$namespace"}[2m])) by(pod, node_id, query_type) | milvus_querynode_sq_queue_latency | La latencia de las peticiones de búsqueda y consulta recibidas por el nodo de consulta. |
Latencia del segmento de búsqueda | La latencia media y el percentil 99 del tiempo que tarda cada nodo de consulta en buscar y consultar un segmento en los últimos dos minutos. El estado de un segmento puede ser cerrado o en crecimiento. | p99: histogram_quantile(0.99, sum by (le, query_type, segment_state, pod, node_id) (rate(milvus_querynode_sq_segment_latency_bucket{app_kubernetes_io_instance=~"$instance", app_kubernetes_io_name="$app_name", namespace="$namespace"}[2m]))) avg: sum(increase(milvus_querynode_sq_segment_latency_sum{app_kubernetes_io_instance=~"$instance", app_kubernetes_io_name="$app_name", namespace="$namespace"}[2m])) by(pod, node_id, query_type, segment_state) / sum(increase(milvus_querynode_sq_segment_latency_count{app_kubernetes_io_instance=~"$instance", app_kubernetes_io_name="$app_name", namespace="$namespace"}[2m])) by(pod, node_id, query_type, segment_state) | milvus_querynode_sq_segment_latency | Tiempo que tarda cada nodo de consulta en buscar y consultar cada segmento. |
Latencia de solicitud Segcore | La latencia media y el percentil 99 del tiempo que cada nodo de consulta tarda en buscar y consultar en segcore en los últimos dos minutos. | p99: histogram_quantile(0.99, sum by (le, query_type, pod, node_id) (rate(milvus_querynode_sq_core_latency_bucket{app_kubernetes_io_instance=~"$instance", app_kubernetes_io_name="$app_name", namespace="$namespace"}[2m]))) avg: sum(increase(milvus_querynode_sq_core_latency_sum{app_kubernetes_io_instance=~"$instance", app_kubernetes_io_name="$app_name", namespace="$namespace"}[2m])) by(pod, node_id, query_type) / sum(increase(milvus_querynode_sq_core_latency_count{app_kubernetes_io_instance=~"$instance", app_kubernetes_io_name="$app_name", namespace="$namespace"}[2m])) by(pod, node_id, query_type) | milvus_querynode_sq_core_latency | El tiempo que tarda cada nodo de consulta en buscar y consultar en segcore. |
Latencia de reducción de búsqueda | La latencia media y el percentil 99 del tiempo utilizado por cada nodo de consulta durante la etapa de reducción de una búsqueda o consulta en los últimos dos minutos. | p99: histogram_quantile(0.99, sum by (le, pod, node_id, query_type) (rate(milvus_querynode_sq_reduce_latency_bucket{app_kubernetes_io_instance=~"$instance", app_kubernetes_io_name="$app_name", namespace="$namespace"}[2m]))) avg: sum(increase(milvus_querynode_sq_reduce_latency_sum{app_kubernetes_io_instance=~"$instance", app_kubernetes_io_name="$app_name", namespace="$namespace"}[2m])) by(pod, node_id, query_type) / sum(increase(milvus_querynode_sq_reduce_latency_count{app_kubernetes_io_instance=~"$instance", app_kubernetes_io_name="$app_name", namespace="$namespace"}[2m])) by(pod, node_id, query_type) | milvus_querynode_sq_reduce_latency | Tiempo empleado por cada consulta durante la etapa de reducción. |
Latencia del segmento de carga | La latencia media y el percentil 99 del tiempo que tarda cada nodo de consulta en cargar un segmento en los últimos dos minutos. | p99: histogram_quantile(0.99, sum by (le, pod, node_id) (rate(milvus_querynode_load_segment_latency_bucket{app_kubernetes_io_instance=~"$instance", app_kubernetes_io_name="$app_name", namespace="$namespace"}[2m]))) avg: sum(increase(milvus_querynode_load_segment_latency_sum{app_kubernetes_io_instance=~"$instance", app_kubernetes_io_name="$app_name", namespace="$namespace"}[2m])) by(pod, node_id) / sum(increase(milvus_querynode_load_segment_latency_count{app_kubernetes_io_instance=~"$instance", app_kubernetes_io_name="$app_name", namespace="$namespace"}[2m])) by(pod, node_id) | milvus_querynode_load_segment_latency_bucket | Tiempo que tarda cada nodo de consulta en cargar un segmento. |
Número de diagramas de flujo | Número de diagramas de flujo en cada nodo de consulta. | sum(milvus_querynode_flowgraph_num{app_kubernetes_io_instance=~"$instance", app_kubernetes_io_name="$app_name", namespace="$namespace"}) by (pod, node_id) | milvus_querynode_flowgraph_num | Número de diagramas de flujo en cada nodo de consulta. |
Longitud de tareas de lectura sin resolver | La longitud de la cola de peticiones de lectura sin resolver en cada nodo de consulta. | sum(milvus_querynode_read_task_unsolved_len{app_kubernetes_io_instance=~"$instance", app_kubernetes_io_name="$app_name", namespace="$namespace"}) by (pod, node_id) | milvus_querynode_read_task_unsolved_len | Longitud de la cola de peticiones de lectura sin resolver. |
Longitud de tarea de lectura lista | Longitud de la cola de peticiones de lectura por ejecutar en cada nodo de consulta. | sum(milvus_querynode_read_task_ready_len{app_kubernetes_io_instance=~"$instance", app_kubernetes_io_name="$app_name", namespace="$namespace"}) by (pod, node_id) | milvus_querynode_read_task_ready_len | Longitud de la cola de peticiones de lectura por ejecutar. |
Número de tareas de lectura paralelas | Número de peticiones de lectura concurrentes ejecutadas actualmente en cada nodo de consulta. | sum(milvus_querynode_read_task_concurrency{app_kubernetes_io_instance=~"$instance", app_kubernetes_io_name="$app_name", namespace="$namespace"}) by (pod, node_id) | milvus_querynode_read_task_concurrency | El número de peticiones de lectura concurrentes ejecutadas actualmente. |
Uso estimado de CPU | El uso de CPU por cada nodo de consulta estimado por el planificador. | sum(milvus_querynode_estimate_cpu_usage{app_kubernetes_io_instance=~"$instance", app_kubernetes_io_name="$app_name", namespace="$namespace"}) by (pod, node_id) | milvus_querynode_estimate_cpu_usage | El uso de CPU por cada nodo de consulta estimado por el planificador. Cuando el valor es 100, significa que se utiliza toda una CPU virtual (vCPU). |
Tamaño del grupo de búsqueda | El número medio y el percentil 99 del tamaño del grupo de búsqueda (es decir, el número total de peticiones de búsqueda originales en las peticiones de búsqueda combinadas ejecutadas por cada nodo de consulta) en los últimos dos minutos. | p99: histogram_quantile(0.99, sum by (le, pod, node_id) (rate(milvus_querynode_search_group_size_bucket{app_kubernetes_io_instance=~"$instance", app_kubernetes_io_name="$app_name", namespace="$namespace"}[2m]))) avg: sum(increase(milvus_querynode_search_group_size_sum{app_kubernetes_io_instance=~"$instance", app_kubernetes_io_name="$app_name", namespace="$namespace"}[2m])) by(pod, node_id) / sum(increase(milvus_querynode_search_group_size_count{app_kubernetes_io_instance=~"$instance", app_kubernetes_io_name="$app_name", namespace="$namespace"}[2m])) by(pod, node_id) | milvus_querynode_load_segment_latency_bucket | El número de tareas de búsqueda originales entre las tareas de búsqueda combinadas de diferentes buckets (es decir, el tamaño del grupo de búsqueda). |
Búsqueda NQ | El número medio y el percentil 99 del número de consultas (NQ) realizadas mientras cada nodo de consulta ejecuta peticiones de búsqueda en los últimos dos minutos. | p99: histogram_quantile(0.99, sum by (le, pod, node_id) (rate(milvus_querynode_search_group_size_bucket{app_kubernetes_io_instance=~"$instance", app_kubernetes_io_name="$app_name", namespace="$namespace"}[2m]))) avg: sum(increase(milvus_querynode_search_group_size_sum{app_kubernetes_io_instance=~"$instance", app_kubernetes_io_name="$app_name", namespace="$namespace"}[2m])) by(pod, node_id) / sum(increase(milvus_querynode_search_group_size_count{app_kubernetes_io_instance=~"$instance", app_kubernetes_io_name="$app_name", namespace="$namespace"}[2m])) by(pod, node_id) | milvus_querynode_load_segment_latency_bucket | Número de consultas (NQ) de solicitudes de búsqueda. |
Grupo de búsqueda NQ | El número medio y el percentil 99 de NQ de solicitudes de búsqueda combinadas y ejecutadas por cada nodo de consulta en los últimos dos minutos. | p99: histogram_quantile(0.99, sum by (le, pod, node_id) (rate(milvus_querynode_search_group_nq_bucket{app_kubernetes_io_instance=~"$instance", app_kubernetes_io_name="$app_name", namespace="$namespace"}[2m]))) avg: sum(increase(milvus_querynode_search_group_nq_sum{app_kubernetes_io_instance=~"$instance", app_kubernetes_io_name="$app_name", namespace="$namespace"}[2m])) by(pod, node_id) / sum(increase(milvus_querynode_search_group_nq_count{app_kubernetes_io_instance=~"$instance", app_kubernetes_io_name="$app_name", namespace="$namespace"}[2m])) by(pod, node_id) | milvus_querynode_load_segment_latency_bucket | El NQ de peticiones de búsqueda combinadas de diferentes buckets. |
Búsqueda Top_K | El número medio y el percentil 99 de Top_K de solicitudes de búsqueda ejecutadas por cada nodo de consulta en los últimos dos minutos. | p99: histogram_quantile(0.99, sum by (le, pod, node_id) (rate(milvus_querynode_search_topk_bucket{app_kubernetes_io_instance=~"$instance", app_kubernetes_io_name="$app_name", namespace="$namespace"}[2m]))) avg: sum(increase(milvus_querynode_search_topk_sum{app_kubernetes_io_instance=~"$instance", app_kubernetes_io_name="$app_name", namespace="$namespace"}[2m])) by(pod, node_id) / sum(increase(milvus_querynode_search_topk_count{app_kubernetes_io_instance=~"$instance", app_kubernetes_io_name="$app_name", namespace="$namespace"}[2m])) by(pod, node_id) | milvus_querynode_load_segment_latency_bucket | El Top_K de las peticiones de búsqueda. |
Grupo de búsqueda Top_K | El número medio y el percentil 99 de Top_K de peticiones de búsqueda combinadas y ejecutadas por cada nodo de consulta en los últimos dos minutos. | p99: histogram_quantile(0.99, sum by (le, pod, node_id) (rate(milvus_querynode_search_group_topk_bucket{app_kubernetes_io_instance=~"$instance", app_kubernetes_io_name="$app_name", namespace="$namespace"}[2m]))) avg: sum(increase(milvus_querynode_search_group_topk_sum{app_kubernetes_io_instance=~"$instance", app_kubernetes_io_name="$app_name", namespace="$namespace"}[2m])) by(pod, node_id) / sum(increase(milvus_querynode_search_group_topk_count{app_kubernetes_io_instance=~"$instance", app_kubernetes_io_name="$app_name", namespace="$namespace"}[2m])) by(pod, node_id) | milvus_querynode_load_segment_latency_bucket | El Top_K de peticiones de búsqueda combinadas de diferentes buckets . |
Tasa de solicitudes de lectura desalojadas | Número de peticiones de lectura desalojadas por segundo por cada nodo de búsqueda en los últimos dos minutos. | sum(increase(milvus_querynode_read_evicted_count{app_kubernetes_io_instance=~"$instance", app_kubernetes_io_name="$app_name", namespace="$namespace"}[2m])/120) by (pod, node_id) | milvus_querynode_sq_req_count | Número acumulado de solicitudes de lectura desalojadas por nodo de consulta debido a restricciones de tráfico. |
Coordinador de datos
Panel | Descripción del panel | PromQL (lenguaje de consulta de Prometheus) | Métricas Milvus utilizadas | Descripción de las métricas Milvus |
---|---|---|---|---|
Número de nodos de datos | Número de nodos de datos gestionados por data coord. | sum(milvus_datacoord_datanode_num{app_kubernetes_io_instance=~"$instance", app_kubernetes_io_name="$app_name", namespace="$namespace"}) by (app_kubernetes_io_instance) | milvus_datacoord_datanode_num | Número de nodos de datos gestionados por data coord. |
Número de segmentos | Número de todos los tipos de segmentos registrados en los metadatos por el coordinador de datos. | sum(milvus_datacoord_segment_num{app_kubernetes_io_instance=~"$instance", app_kubernetes_io_name="$app_name", namespace="$namespace"}) by (segment_state) | milvus_datacoord_segment_num | El número de todos los tipos de segmentos registrados en metadatos por data coord. Los tipos de segmento incluyen: abandonado, enjuagado, en crecimiento y sellado. |
Número de colecciones | Número de colecciones registradas en los metadatos por coordenada de datos. | sum(milvus_datacoord_collection_num{app_kubernetes_io_instance=~"$instance", app_kubernetes_io_name="$app_name", namespace="$namespace"}) by (app_kubernetes_io_instance) | milvus_datacoord_collection_num | Número de colecciones registradas en los metadatos por coordenada de datos. |
Filas almacenadas | Número acumulado de filas de datos válidos y vaciados en el código de datos. | sum(milvus_datacoord_stored_rows_num{app_kubernetes_io_instance=~"$instance", app_kubernetes_io_name="$app_name", namespace="$namespace"}) by (app_kubernetes_io_instance) | milvus_datacoord_stored_rows_num | Número acumulado de filas de datos válidos y vaciados en la coordinación de datos. |
Ritmo de filas almacenadas | Número medio de filas vaciadas por segundo en los últimos dos minutos. | sum(increase(milvus_datacoord_stored_rows_count{app_kubernetes_io_instance=~"$instance", app_kubernetes_io_name="$app_name", namespace="$namespace"}[2m])/120) by (pod, node_id) | milvus_datacoord_stored_rows_count | Número acumulado de filas vaciadas por coordenada de datos. |
Tiempo de sincronización | El número medio, máximo y mínimo de tiempo de época sincronizado por data coord en cada canal físico. | avg(milvus_datacoord_sync_epoch_time{app_kubernetes_io_instance=~"$instance", app_kubernetes_io_name="$app_name", namespace="$namespace"}) by (app_kubernetes_io_instance) max(milvus_datacoord_sync_epoch_time{app_kubernetes_io_instance=~"$instance", app_kubernetes_io_name="$app_name", namespace="$namespace"}) by (app_kubernetes_io_instance) min(milvus_datacoord_sync_epoch_time{app_kubernetes_io_instance=~"$instance", app_kubernetes_io_name="$app_name", namespace="$namespace"}) by (app_kubernetes_io_instance) | milvus_datacoord_sync_epoch_time | El tiempo de época de cada canal físico (tiempo Unix, los milisegundos transcurridos desde el 1 de enero de 1970). |
Tamaño del binlog almacenado | El tamaño total del binlog almacenado. | sum(milvus_datacoord_stored_binlog_size{app_kubernetes_io_instance=~"$instance", app_kubernetes_io_name="$app_name", namespace="$namespace"}) by (app_kubernetes_io_instance) | milvus_datacoord_stored_binlog_size | El tamaño total del binlog almacenado en Milvus. |
Nodo de datos
Panel | Descripción del panel | PromQL (Lenguaje de consulta de Prometheus) | Las métricas Milvus utilizadas | Descripción de las métricas Milvus |
---|---|---|---|---|
Número del diagrama de flujo | El número de objetos del diagrama de flujo que corresponden a cada nodo de datos. | sum(milvus_datanode_flowgraph_num{app_kubernetes_io_instance=~"$instance", app_kubernetes_io_name="$app_name", namespace="$namespace"}) by (pod, node_id) | milvus_datanode_flowgraph_num | Número de objetos del diagrama de flujo. Cada fragmento de una colección corresponde a un objeto del diagrama de flujo. |
Tasa de consumo de filas de mensajes | Número de filas de mensajes de flujo consumidas por segundo por cada nodo de datos en los últimos dos minutos. | sum(increase(milvus_datanode_msg_rows_count{app_kubernetes_io_instance=~"$instance", app_kubernetes_io_name="$app_name", namespace="$namespace"}[2m])/120) by (msg_type, pod, node_id) | milvus_datanode_msg_rows_count | Número de filas de mensajes de flujo consumidos. Actualmente, los mensajes de flujo contados por nodo de datos sólo incluyen mensajes de inserción y borrado. |
Tasa de tamaño de datos de descarga | El tamaño de cada mensaje vaciado registrado por segundo por cada nodo de datos en los últimos dos minutos. | sum(increase(milvus_datanode_flushed_data_size{app_kubernetes_io_instance=~"$instance", app_kubernetes_io_name="$app_name", namespace="$namespace"}[2m])/120) by (msg_type, pod, node_id) | milvus_datanode_flushed_data_size | El tamaño de cada mensaje vaciado. Actualmente, los mensajes de flujo contados por nodo de datos sólo incluyen mensajes de inserción y borrado. |
Número de consumidores | Número de consumidores creados en cada nodo de datos. | sum(milvus_datanode_consumer_num{app_kubernetes_io_instance=~"$instance", app_kubernetes_io_name="$app_name", namespace="$namespace"}) by (pod, node_id) | milvus_datanode_consumer_num | Número de consumidores creados en cada nodo de datos. Cada diagrama de flujo corresponde a un consumidor. |
Número de productores | Número de productores creados en cada nodo de datos. | sum(milvus_datanode_producer_num{app_kubernetes_io_instance=~"$instance", app_kubernetes_io_name="$app_name", namespace="$namespace"}) by (pod, node_id) | milvus_datanode_producer_num | Número de consumidores creados en cada nodo de datos. Cada fragmento de una colección corresponde a un productor de canal delta y a un productor de canal timetick. |
Tiempo de sincronización | El número medio, máximo y mínimo de tiempo de época sincronizado por cada nodo de datos en todos los temas físicos. | avg(milvus_datanode_sync_epoch_time{app_kubernetes_io_instance=~"$instance", app_kubernetes_io_name="$app_name", namespace="$namespace"}) by (pod, node_id) max(milvus_datanode_sync_epoch_time{app_kubernetes_io_instance=~"$instance", app_kubernetes_io_name="$app_name", namespace="$namespace"}) by (pod, node_id) min(milvus_datanode_sync_epoch_time{app_kubernetes_io_instance=~"$instance", app_kubernetes_io_name="$app_name", namespace="$namespace"}) by (pod, node_id) | milvus_datanode_sync_epoch_time | El tiempo de época (tiempo Unix, los milisegundos transcurridos desde el 1 de enero de 1970.) de cada tema físico en un nodo de datos. |
Número de segmentos no vaciados | El número de segmentos no vaciados creados en cada nodo de datos. | sum(milvus_datanode_unflushed_segment_num{app_kubernetes_io_instance=~"$instance", app_kubernetes_io_name="$app_name", namespace="$namespace"}) by (pod, node_id) | milvus_datanode_unflushed_segment_num | Número de segmentos no vaciados creados en cada nodo de datos. |
Latencia del búfer de codificación | La latencia media y el percentil 99 del tiempo utilizado para codificar un búfer por cada nodo de datos en los últimos dos minutos. | p99: histogram_quantile(0.99, sum by (le, pod, node_id) (rate(milvus_datanode_encode_buffer_latency_bucket{app_kubernetes_io_instance=~"$instance", app_kubernetes_io_name="$app_name", namespace="$namespace"}[2m]))) avg: sum(increase(milvus_datanode_encode_buffer_latency_sum{app_kubernetes_io_instance=~"$instance", app_kubernetes_io_name="$app_name", namespace="$namespace"}[2m])) by(pod, node_id) / sum(increase(milvus_datanode_encode_buffer_latency_count{app_kubernetes_io_instance=~"$instance", app_kubernetes_io_name="$app_name", namespace="$namespace"}[2m])) by(pod, node_id) | milvus_datanode_encode_buffer_latency | El tiempo que tarda cada nodo de datos en codificar un búfer. |
Latencia de almacenamiento de datos | La latencia media y el percentil 99 del tiempo utilizado para escribir un búfer en la capa de almacenamiento por cada nodo de datos en los últimos dos minutos. | p99: histogram_quantile(0.99, sum by (le, pod, node_id) (rate(milvus_datanode_save_latency_bucket{app_kubernetes_io_instance=~"$instance", app_kubernetes_io_name="$app_name", namespace="$namespace"}[2m]))) avg: sum(increase(milvus_datanode_save_latency_sum{app_kubernetes_io_instance=~"$instance", app_kubernetes_io_name="$app_name", namespace="$namespace"}[2m])) by(pod, node_id) / sum(increase(milvus_datanode_save_latency_count{app_kubernetes_io_instance=~"$instance", app_kubernetes_io_name="$app_name", namespace="$namespace"}[2m])) by(pod, node_id) | milvus_datanode_save_latency | Tiempo que tarda cada nodo de datos en escribir un búfer en la capa de almacenamiento. |
Tasa de operaciones de descarga | Número de veces que cada nodo de datos vacía un búfer por segundo en los últimos dos minutos. | sum(increase(milvus_datanode_flush_buffer_op_count{app_kubernetes_io_instance=~"$instance", app_kubernetes_io_name="$app_name", namespace="$namespace"}[2m])/120) by (status, pod, node_id) | milvus_datanode_flush_buffer_op_count | Número acumulado de veces que un nodo de datos descarga un búfer. |
Tasa de operación de descarga automática | Número de veces que cada nodo de datos descarga automáticamente un búfer por segundo en los últimos dos minutos. | sum(increase(milvus_datanode_autoflush_buffer_op_count{app_kubernetes_io_instance=~"$instance", app_kubernetes_io_name="$app_name", namespace="$namespace"}[2m])/120) by (status, pod, node_id) | milvus_datanode_autoflush_buffer_op_count | Número acumulado de veces que un nodo de datos descarga automáticamente un búfer. |
Índice de solicitudes de descarga | Número de veces que cada nodo de datos recibe una solicitud de vaciado de búfer por segundo en los últimos dos minutos. | sum(increase(milvus_datanode_flush_req_count{app_kubernetes_io_instance=~"$instance", app_kubernetes_io_name="$app_name", namespace="$namespace"}[2m])/120) by (status, pod, node_id) | milvus_datanode_flush_req_count | Número acumulado de veces que un nodo de datos recibe una solicitud de vaciado de un búfer. |
Latencia de compactación | La latencia media y el percentil 99 del tiempo que cada nodo de datos tarda en ejecutar una tarea de compactación en los últimos dos minutos. | p99: histogram_quantile(0.99, sum by (le, pod, node_id) (rate(milvus_datanode_compaction_latency_bucket{app_kubernetes_io_instance=~"$instance", app_kubernetes_io_name="$app_name", namespace="$namespace"}[2m]))) avg: sum(increase(milvus_datanode_compaction_latency_sum{app_kubernetes_io_instance=~"$instance", app_kubernetes_io_name="$app_name", namespace="$namespace"}[2m])) by(pod, node_id) / sum(increase(milvus_datanode_compaction_latency_count{app_kubernetes_io_instance=~"$instance", app_kubernetes_io_name="$app_name", namespace="$namespace"}[2m])) by(pod, node_id) | milvus_datanode_compaction_latency | El tiempo que tarda cada nodo de datos en ejecutar una tarea de compactación. |
Índice coordinador
Panel | Descripción del panel | PromQL (lenguaje de consulta de Prometheus) | Las métricas Milvus utilizadas | Descripción de las métricas Milvus |
---|---|---|---|---|
Tasa de peticiones de índice | Número medio de solicitudes de creación de índices recibidas por segundo en los últimos dos minutos. | sum(increase(milvus_indexcoord_indexreq_count{app_kubernetes_io_instance=~"$instance", app_kubernetes_io_name="$app_name", namespace="$namespace"}[2m])/120) by (status) | milvus_indexcoord_indexreq_count | Número de solicitudes de creación de índices recibidas. |
Recuento de tareas de indexación | Recuento de todas las tareas de indexación registradas en los metadatos del índice. | sum(milvus_indexcoord_indextask_count{app_kubernetes_io_instance=~"$instance", app_kubernetes_io_name="$app_name", namespace="$namespace"}) by (index_task_status) | milvus_indexcoord_indextask_count | Recuento de todas las tareas de indexación registradas en los metadatos del índice. |
Número de nodos de índice | Número de nodos de índice gestionados. | sum(milvus_indexcoord_indexnode_num{app_kubernetes_io_instance=~"$instance", app_kubernetes_io_name="$app_name", namespace="$namespace"}) by (app_kubernetes_io_instance) | milvus_indexcoord_indexnode_num | Número de nodos de índice gestionados. |
Nodo de índice
Panel | Descripción del panel | PromQL (lenguaje de consulta de Prometheus) | Las métricas Milvus utilizadas | Descripción de las métricas Milvus |
---|---|---|---|---|
Tasa de tareas de índice | Número medio de tareas de creación de índices recibidas por cada nodo de índice por segundo en los últimos dos minutos. | sum(increase(milvus_indexnode_index_task_count{app_kubernetes_io_instance=~"$instance", app_kubernetes_io_name="$app_name", namespace="$namespace"}[2m])/120) by (status, pod, node_id) | milvus_indexnode_index_task_count | Número de tareas de creación de índices recibidas. |
Latencia del campo de carga | La latencia media y el percentil 99 del tiempo utilizado por cada nodo de índice para cargar datos de campo de segmento cada vez en los últimos dos minutos. | p99: histogram_quantile(0.99, sum by (le, pod, node_id) (rate(milvus_indexnode_load_field_latency_bucket{app_kubernetes_io_instance=~"$instance", app_kubernetes_io_name="$app_name", namespace="$namespace"}[2m]))) avg: sum(increase(milvus_indexnode_load_field_latency_sum{app_kubernetes_io_instance=~"$instance", app_kubernetes_io_name="$app_name", namespace="$namespace"}[2m])) by(pod, node_id) / sum(increase(milvus_indexnode_load_field_latency_count{app_kubernetes_io_instance=~"$instance", app_kubernetes_io_name="$app_name", namespace="$namespace"}[2m])) by(pod, node_id) | milvus_indexnode_load_field_latency | El tiempo utilizado por el nodo de índice para cargar los datos del campo de segmento. |
Latencia del campo de descodificación | La latencia media y el percentil 99 del tiempo utilizado por cada nodo de índice para codificar datos de campo cada vez en los últimos dos minutos. | p99: histogram_quantile(0.99, sum by (le, pod, node_id) (rate(milvus_indexnode_decode_field_latency_bucket{app_kubernetes_io_instance=~"$instance", app_kubernetes_io_name="$app_name", namespace="$namespace"}[2m]))) avg: sum(increase(milvus_indexnode_decode_field_latency_sum{app_kubernetes_io_instance=~"$instance", app_kubernetes_io_name="$app_name", namespace="$namespace"}[2m])) by(pod, node_id) / sum(increase(milvus_indexnode_decode_field_latency_count{app_kubernetes_io_instance=~"$instance", app_kubernetes_io_name="$app_name", namespace="$namespace"}[2m])) by(pod, node_id) | milvus_indexnode_decode_field_latency | El tiempo utilizado para descodificar los datos de campo. |
Latencia del índice de construcción | La latencia media y el percentil 99 del tiempo utilizado por cada nodo de índice para construir índices en los últimos dos minutos. | p99: histogram_quantile(0.99, sum by (le, pod, node_id) (rate(milvus_indexnode_build_index_latency_bucket{app_kubernetes_io_instance=~"$instance", app_kubernetes_io_name="$app_name", namespace="$namespace"}[2m]))) avg: sum(increase(milvus_indexnode_build_index_latency_sum{app_kubernetes_io_instance=~"$instance", app_kubernetes_io_name="$app_name", namespace="$namespace"}[2m])) by(pod, node_id) / sum(increase(milvus_indexnode_build_index_latency_count{app_kubernetes_io_instance=~"$instance", app_kubernetes_io_name="$app_name", namespace="$namespace"}[2m])) by(pod, node_id) | milvus_indexnode_build_index_latency | El tiempo utilizado para construir índices. |
Latencia del índice de codificación | La latencia media y el percentil 99 del tiempo utilizado por cada nodo de índice para codificar archivos de índice en los últimos dos minutos. | p99: histogram_quantile(0.99, sum by (le, pod, node_id) (rate(milvus_indexnode_encode_index_latency_bucket{app_kubernetes_io_instance=~"$instance", app_kubernetes_io_name="$app_name", namespace="$namespace"}[2m]))) avg: sum(increase(milvus_indexnode_encode_index_latency_sum{app_kubernetes_io_instance=~"$instance", app_kubernetes_io_name="$app_name", namespace="$namespace"}[2m])) by(pod, node_id) / sum(increase(milvus_indexnode_encode_index_latency_count{app_kubernetes_io_instance=~"$instance", app_kubernetes_io_name="$app_name", namespace="$namespace"}[2m])) by(pod, node_id) | milvus_indexnode_encode_index_latency | El tiempo utilizado para codificar archivos de índice. |
Guardar latencia de índice | La latencia media y el percentil 99 del tiempo utilizado por cada nodo de índice para guardar archivos de índice en los últimos dos minutos. | p99: histogram_quantile(0.99, sum by (le, pod, node_id) (rate(milvus_indexnode_save_index_latency_bucket{app_kubernetes_io_instance=~"$instance", app_kubernetes_io_name="$app_name", namespace="$namespace"}[2m]))) avg: sum(increase(milvus_indexnode_save_index_latency_sum{app_kubernetes_io_instance=~"$instance", app_kubernetes_io_name="$app_name", namespace="$namespace"}[2m])) by(pod, node_id) / sum(increase(milvus_indexnode_save_index_latency_count{app_kubernetes_io_instance=~"$instance", app_kubernetes_io_name="$app_name", namespace="$namespace"}[2m])) by(pod, node_id) | milvus_indexnode_save_index_latency | El tiempo utilizado para guardar archivos de índice. |