Tableau de bord des mesures de Milvus
Milvus produit une liste de métriques détaillées de séries temporelles pendant l'exécution. Vous pouvez utiliser Prometheus et Grafana pour visualiser les métriques. Cette rubrique présente les métriques de surveillance affichées dans le tableau de bord Grafana Milvus.
L'unité de temps utilisée dans cette rubrique est la milliseconde. Et "99ème percentile" dans cette rubrique fait référence au fait que 99 pour cent des statistiques de temps sont contrôlées dans une certaine valeur.
Nous vous recommandons de lire l'aperçu du cadre de surveillance Milvus pour comprendre d'abord les métriques Prometheus.
Proxy
Panel | Description du panneau | PromQL (langage de requête Prometheus) | Les métriques Milvus utilisées | Description des métriques Milvus |
---|---|---|---|---|
Taux de comptage des vecteurs de recherche | Nombre moyen de vecteurs interrogés par seconde par chaque proxy au cours des deux dernières minutes. | sum(increase(milvus_proxy_search_vectors_count{app_kubernetes_io_instance=~"$instance", app_kubernetes_io_name="$app_name", namespace="$namespace"}[2m])/120) by (pod, node_id) | milvus_proxy_search_vectors_count | Nombre cumulé de vecteurs interrogés. |
Taux de comptage des vecteurs d'insertion | Nombre moyen de vecteurs insérés par seconde par chaque proxy au cours des deux dernières minutes. | sum(increase(milvus_proxy_insert_vectors_count{app_kubernetes_io_instance=~"$instance", app_kubernetes_io_name="$app_name", namespace="$namespace"}[2m])/120) by (pod, node_id) | milvus_proxy_insert_vectors_count | Nombre cumulé de vecteurs insérés. |
Temps de latence de la recherche | Temps de latence moyen et 99e percentile du temps de latence pour la réception des demandes de recherche et d'interrogation par chaque mandataire au cours des deux dernières minutes. | p99 : histogram_quantile(0.99, sum by (le, query_type, pod, node_id) (rate(milvus_proxy_sq_latency_bucket{app_kubernetes_io_instance=~"$instance", app_kubernetes_io_name="$app_name", namespace="$namespace"}[2m]))) avg : sum(increase(milvus_proxy_sq_latency_sum{app_kubernetes_io_instance=~"$instance", app_kubernetes_io_name="$app_name", namespace="$namespace"}[2m])) by (pod, node_id, query_type) / sum(increase(milvus_proxy_sq_latency_count{app_kubernetes_io_instance=~"$instance", app_kubernetes_io_name="$app_name", namespace="$namespace"}[2m])) by (pod, node_id, query_type) | milvus_proxy_sq_latency | Temps de latence des demandes de recherche et d'interrogation. |
Temps de latence de la recherche dans la collection | Temps de latence moyen et 99e percentile de la latence de réception des demandes de recherche et d'interrogation d'une collection spécifique par chaque proxy au cours des deux dernières minutes. | p99 : histogram_quantile(0.99, sum by (le, query_type, pod, node_id) (rate(milvus_proxy_collection_sq_latency_bucket{app_kubernetes_io_instance=~"$instance", app_kubernetes_io_name="$app_name", namespace="$namespace", collection_name=~"$collection"}[2m]))) avg : sum(increase(milvus_proxy_collection_sq_latency_sum{app_kubernetes_io_instance=~"$instance", app_kubernetes_io_name="$app_name", namespace="$namespace", collection_name=~"$collection"}[2m])) by (pod, node_id, query_type) / sum(increase(milvus_proxy_collection_sq_latency_count{app_kubernetes_io_instance=~"$instance", app_kubernetes_io_name="$app_name", namespace="$namespace", collection_name=~"$collection"}[2m])) by (pod, node_id, query_type) | milvus_proxy_collection_sq_latency_sum | Temps de latence des demandes de recherche et d'interrogation d'une collection spécifique |
Latence de mutation | Temps de latence moyen et 99e percentile du temps de latence pour la réception de demandes de mutation par chaque proxy au cours des deux dernières minutes. | p99 : histogram_quantile(0.99, sum by (le, msg_type, pod, node_id) (rate(milvus_proxy_mutation_latency_bucket{app_kubernetes_io_instance=~"$instance", app_kubernetes_io_name="$app_name", namespace="$namespace"}[2m]))) avg : sum(increase(milvus_proxy_mutation_latency_sum{app_kubernetes_io_instance=~"$instance", app_kubernetes_io_name="$app_name", namespace="$namespace"}[2m])) by (pod, node_id, msg_type) / sum(increase(milvus_proxy_mutation_latency_count{app_kubernetes_io_instance=~"$instance", app_kubernetes_io_name="$app_name", namespace="$namespace"}[2m])) by (pod, node_id, msg_type) | milvus_proxy_mutation_latency_sum | Temps de latence des demandes de mutation. |
Temps de latence de la mutation de la collection | Temps de latence moyen et 99e percentile de la latence de réception des demandes de mutation vers une collection spécifique par chaque proxy au cours des deux dernières minutes. | p99 : histogram_quantile(0.99, sum by (le, query_type, pod, node_id) (rate(milvus_proxy_collection_sq_latency_bucket{app_kubernetes_io_instance=~"$instance", app_kubernetes_io_name="$app_name", namespace="$namespace", collection_name=~"$collection"}[2m]))) avg : sum(increase(milvus_proxy_collection_sq_latency_sum{app_kubernetes_io_instance=~"$instance", app_kubernetes_io_name="$app_name", namespace="$namespace", collection_name=~"$collection"}[2m])) by (pod, node_id, query_type) / sum(increase(milvus_proxy_collection_sq_latency_count{app_kubernetes_io_instance=~"$instance", app_kubernetes_io_name="$app_name", namespace="$namespace", collection_name=~"$collection"}[2m])) by (pod, node_id, query_type) | milvus_proxy_collection_sq_latency_sum | Temps de latence des demandes de mutation vers une collection spécifique |
Temps d'attente des résultats de recherche | Temps de latence moyen et 99e centile du temps de latence entre l'envoi de demandes de recherche et de requête et la réception des résultats par proxy au cours des deux dernières minutes. | p99 : histogram_quantile(0.99, sum by (le, query_type, pod, node_id) (rate(milvus_proxy_sq_wait_result_latency_bucket{app_kubernetes_io_instance=~"$instance", app_kubernetes_io_name="$app_name", namespace="$namespace"}[2m]))) avg : sum(increase(milvus_proxy_sq_wait_result_latency_sum{app_kubernetes_io_instance=~"$instance", app_kubernetes_io_name="$app_name", namespace="$namespace"}[2m])) by (pod, node_id, query_type) / sum(increase(milvus_proxy_sq_wait_result_latency_count{app_kubernetes_io_instance=~"$instance", app_kubernetes_io_name="$app_name", namespace="$namespace"}[2m])) by (pod, node_id, query_type) | milvus_proxy_sq_wait_result_latency | Temps de latence entre l'envoi de demandes de recherche et de requête et la réception des résultats. |
Réduire la latence des résultats de recherche | Temps de latence moyen et 99e percentile du temps de latence pour l'agrégation des résultats de recherche et de requête par proxy au cours des deux dernières minutes. | p99 : histogram_quantile(0.99, sum by (le, query_type, pod, node_id) (rate(milvus_proxy_sq_reduce_result_latency_bucket{app_kubernetes_io_instance=~"$instance", app_kubernetes_io_name="$app_name", namespace="$namespace"}[2m]))) avg : sum(increase(milvus_proxy_sq_reduce_result_latency_sum{app_kubernetes_io_instance=~"$instance", app_kubernetes_io_name="$app_name", namespace="$namespace"}[2m])) by (pod, node_id, query_type) / sum(increase(milvus_proxy_sq_reduce_result_latency_count{app_kubernetes_io_instance=~"$instance", app_kubernetes_io_name="$app_name", namespace="$namespace"}[2m])) by (pod, node_id, query_type) | milvus_proxy_sq_reduce_result_latency | Temps de latence de l'agrégation des résultats de recherche et d'interrogation renvoyés par chaque nœud d'interrogation. |
Temps de latence du décodage des résultats de recherche | Temps de latence moyen et 99e centile du temps de latence du décodage des résultats de recherche et d'interrogation par proxy au cours des deux dernières minutes. | p99 : histogram_quantile(0.99, sum by (le, query_type, pod, node_id) (rate(milvus_proxy_sq_decode_result_latency_bucket{app_kubernetes_io_instance=~"$instance", app_kubernetes_io_name="$app_name", namespace="$namespace"}[2m]))) avg : sum(increase(milvus_proxy_sq_decode_result_latency_sum{app_kubernetes_io_instance=~"$instance", app_kubernetes_io_name="$app_name", namespace="$namespace"}[2m])) by (pod, node_id, query_type) / sum(increase(milvus_proxy_sq_decode_resultlatency_count{app_kubernetes_io_instance=~"$instance", app_kubernetes_io_name="$app_name", namespace="$namespace"}[2m])) by (pod, node_id, query_type) | milvus_proxy_sq_decode_result_latency | Temps de latence du décodage de chaque résultat de recherche et de requête. |
Msg Stream Object Num | Nombre moyen, maximum et minimum d'objets msgstream créés par chaque proxy sur le sujet physique correspondant au cours des deux dernières minutes. | avg(milvus_proxy_msgstream_obj_num{app_kubernetes_io_instance=~"$instance", app_kubernetes_io_name="$app_name", namespace="$namespace"}) by (pod, node_id) max(milvus_proxy_msgstream_obj_num{app_kubernetes_io_instance=~"$instance", app_kubernetes_io_name="$app_name", namespace="$namespace"}) by (pod, node_id) min(milvus_proxy_msgstream_obj_num{app_kubernetes_io_instance=~"$instance", app_kubernetes_io_name="$app_name", namespace="$namespace"}) by (pod, node_id) | milvus_proxy_msgstream_obj_num | Le nombre d'objets msgstream créés sur chaque sujet physique. |
Latence d'envoi des mutations | Temps de latence moyen et 99e centile du temps de latence de l'envoi de demandes d'insertion ou de suppression par chaque proxy au cours des deux dernières minutes. | p99 : histogram_quantile(0.99, sum by (le, msg_type, pod, node_id) (rate(milvus_proxy_mutation_send_latency_bucket{app_kubernetes_io_instance=~"$instance", app_kubernetes_io_name="$app_name", namespace="$namespace"}[2m]))) avg : sum(increase(milvus_proxy_mutation_send_latency_sum{app_kubernetes_io_instance=~"$instance", app_kubernetes_io_name="$app_name", namespace="$namespace"}[2m])) by (pod, node_id, msg_type) / sum(increase(milvus_proxy_mutation_send_latency_count{app_kubernetes_io_instance=~"$instance", app_kubernetes_io_name="$app_name", namespace="$namespace"}[2m])) by (pod, node_id, msg_type) | milvus_proxy_mutation_send_latency | Temps de latence pour l'envoi de demandes d'insertion ou de suppression. |
Taux de réussite du cache | Le taux moyen de réussite des opérations dans le cache, y compris GeCollectionID , GetCollectionInfo , et GetCollectionSchema par seconde au cours des deux dernières minutes. | sum(increase(milvus_proxy_cache_hit_count{app_kubernetes_io_instance=~"$instance", app_kubernetes_io_name="$app_name", namespace="$namespace", cache_state="hit"}[2m])/120) by(cache_name, pod, node_id) / sum(increase(milvus_proxy_cache_hit_count{app_kubernetes_io_instance=~"$instance", app_kubernetes_io_name="$app_name", namespace="$namespace"}[2m])/120) by(cache_name, pod, node_id) | milvus_proxy_cache_hit_count | Statistiques des taux de réussite et d'échec de chaque opération de lecture du cache. |
Latence de mise à jour de la mémoire cache | La latence moyenne et le 99e percentile de la latence de mise à jour du cache par proxy au cours des deux dernières minutes. | p99 : histogram_quantile(0.99, sum by (le, pod, node_id) (rate(milvus_proxy_cache_update_latency_bucket{app_kubernetes_io_instance=~"$instance", app_kubernetes_io_name="$app_name", namespace="$namespace"}[2m]))) avg : sum(increase(milvus_proxy_cache_update_latency_sum{app_kubernetes_io_instance=~"$instance", app_kubernetes_io_name="$app_name", namespace="$namespace"}[2m])) by (pod, node_id) / sum(increase(milvus_proxy_cache_update_latency_count{app_kubernetes_io_instance=~"$instance", app_kubernetes_io_name="$app_name", namespace="$namespace"}[2m])) by (pod, node_id) | milvus_proxy_cache_update_latency | Temps de latence de la mise à jour du cache à chaque fois. |
Temps de synchronisation | Le nombre moyen, maximum et minimum d'heures d'horloge synchronisées par chaque proxy dans le canal physique correspondant. | avg(milvus_proxy_sync_epoch_time{app_kubernetes_io_instance=~"$instance", app_kubernetes_io_name="$app_name", namespace="$namespace"}) by (pod, node_id) max(milvus_proxy_sync_epoch_time{app_kubernetes_io_instance=~"$instance", app_kubernetes_io_name="$app_name", namespace="$namespace"}) by (pod, node_id) min(milvus_proxy_sync_epoch_time{app_kubernetes_io_instance=~"$instance", app_kubernetes_io_name="$app_name", namespace="$namespace"}) by (pod, node_id) | milvus_proxy_sync_epoch_time | L'heure d'origine de chaque canal physique (heure Unix, millisecondes écoulées depuis le 1er janvier 1970). Il y a un ChannelName par défaut en dehors des canaux physiques. |
Appliquer la latence PK | La latence moyenne et le 99ème percentile de la latence de l'application de la clé primaire par chaque proxy au cours des deux dernières minutes. | p99 : histogram_quantile(0.99, sum by (le, pod, node_id) (rate(milvus_proxy_apply_pk_latency_bucket{app_kubernetes_io_instance=~"$instance", app_kubernetes_io_name="$app_name", namespace="$namespace"}[2m]))) avg : sum(increase(milvus_proxy_apply_pk_latency_sum{app_kubernetes_io_instance=~"$instance", app_kubernetes_io_name="$app_name", namespace="$namespace"}[2m])) by (pod, node_id) / sum(increase(milvus_proxy_apply_pk_latency_count{app_kubernetes_io_instance=~"$instance", app_kubernetes_io_name="$app_name", namespace="$namespace"}[2m])) by (pod, node_id) | milvus_proxy_apply_pk_latency | Le temps de latence de l'application de la clé primaire. |
Temps de latence de l'horodatage de l'application | Le temps de latence moyen et le 99ème percentile du temps de latence de l'application de l'horodatage par chaque proxy au cours des deux dernières minutes. | p99 : histogram_quantile(0.99, sum by (le, pod, node_id) (rate(milvus_proxy_apply_timestamp_latency_bucket{app_kubernetes_io_instance=~"$instance", app_kubernetes_io_name="$app_name", namespace="$namespace"}[2m]))) avg : sum(increase(milvus_proxy_apply_timestamp_latency_sum{app_kubernetes_io_instance=~"$instance", app_kubernetes_io_name="$app_name", namespace="$namespace"}[2m])) by (pod, node_id) / sum(increase(milvus_proxy_apply_timestamp_latency_count{app_kubernetes_io_instance=~"$instance", app_kubernetes_io_name="$app_name", namespace="$namespace"}[2m])) by (pod, node_id) | milvus_proxy_apply_timestamp_latency | Le temps de latence de l'application de l'horodatage. |
Taux de réussite des demandes | Le nombre de requêtes réussies reçues par seconde par chaque proxy, avec une ventilation détaillée de chaque type de requête. Les types de demandes possibles sont DescribeCollection, DescribeIndex, GetCollectionStatistics, HasCollection, Search, Query, ShowPartitions, Insert, etc. | |||
sum(increase(milvus_proxy_req_count{app_kubernetes_io_instance=~"$instance", app_kubernetes_io_name="$app_name", namespace="$namespace", status="success"}[2m])/120) by(function_name, pod, node_id) | milvus_proxy_req_count | Nombre de tous les types de demandes reçues | ||
Taux d'échec des demandes | Le nombre de demandes échouées reçues par seconde par chaque proxy, avec une ventilation détaillée de chaque type de demande. Les types de demandes possibles sont DescribeCollection, DescribeIndex, GetCollectionStatistics, HasCollection, Search, Query, ShowPartitions, Insert, etc. | |||
sum(increase(milvus_proxy_req_count{app_kubernetes_io_instance=~"$instance", app_kubernetes_io_name="$app_name", namespace="$namespace", status="fail"}[2m])/120) by(function_name, pod, node_id) | milvus_proxy_req_count | Nombre de tous les types de demandes reçues | ||
Temps de latence des requêtes | La latence moyenne et le 99e percentile de la latence de tous les types de requêtes reçues par chaque proxy. | p99 : histogram_quantile(0.99, sum by (le, pod, node_id, function_name) (rate(milvus_proxy_req_latency_bucket{app_kubernetes_io_instance=~"$instance", app_kubernetes_io_name="$app_name", namespace="$namespace"}[2m]))) avg : sum(increase(milvus_proxy_req_latency_sum{app_kubernetes_io_instance=~"$instance", app_kubernetes_io_name="$app_name", namespace="$namespace"}[2m])) by (pod, node_id, function_name) / sum(increase(milvus_proxy_req_latency_count{app_kubernetes_io_instance=~"$instance", app_kubernetes_io_name="$app_name", namespace="$namespace"}[2m])) by (pod, node_id, function_name) | milvus_proxy_req_latency | Le temps de latence de tous les types de demandes de réception |
Taux d'octets des demandes d'insertion/suppression | Nombre d'octets de demandes d'insertion et de suppression reçus par seconde par le proxy au cours des deux dernières minutes. | sum(increase(milvus_proxy_receive_bytes_count{app_kubernetes_io_instance=~"$instance", app_kubernetes_io_name="$app_name", namespace="$namespace"}[2m])/120) by(pod, node_id) | milvus_proxy_receive_bytes_count | Le nombre de demandes d'insertion et de suppression. |
Taux d'envoi d'octets | Nombre d'octets par seconde renvoyés au client pendant que chaque proxy répond aux demandes de recherche et de requête au cours des deux dernières minutes. | sum(increase(milvus_proxy_send_bytes_count{app_kubernetes_io_instance=~"$instance", app_kubernetes_io_name="$app_name", namespace="$namespace"}[2m])/120) by(pod, node_id) | milvus_proxy_send_bytes_count | Nombre d'octets renvoyés au client pendant que chaque proxy répond aux demandes de recherche et d'interrogation. |
Coordinateur racine
Panneau | Description du panel | PromQL (langage de requête Prometheus) | Les métriques Milvus utilisées | Description des métriques Milvus |
---|---|---|---|---|
Proxy Node Num | Nombre de proxies créés. | sum(milvus_rootcoord_proxy_num{app_kubernetes_io_instance=~"$instance", app_kubernetes_io_name="$app_name", namespace="$namespace"}) by (app_kubernetes_io_instance) | milvus_rootcoord_proxy_num | Le nombre de proxies. |
Sync Time | Le nombre moyen, maximum et minimum de temps d'époque synchronisés par chaque coordonnée racine dans chaque canal physique (PChannel). | avg(milvus_rootcoord_sync_epoch_time{app_kubernetes_io_instance=~"$instance", app_kubernetes_io_name="$app_name", namespace="$namespace"}) by (app_kubernetes_io_instance) max(milvus_rootcoord_sync_epoch_time{app_kubernetes_io_instance=~"$instance", app_kubernetes_io_name="$app_name", namespace="$namespace"}) by (app_kubernetes_io_instance) min(milvus_rootcoord_sync_epoch_time{app_kubernetes_io_instance=~"$instance", app_kubernetes_io_name="$app_name", namespace="$namespace"}) by (app_kubernetes_io_instance) | milvus_rootcoord_sync_epoch_time | L'heure de référence de chaque canal physique (heure Unix, millisecondes écoulées depuis le 1er janvier 1970). |
Taux de requêtes DDL | L'état et le nombre de requêtes DDL par seconde au cours des deux dernières minutes. | sum(increase(milvus_rootcoord_ddl_req_count{app_kubernetes_io_instance=~"$instance", app_kubernetes_io_name="$app_name", namespace="$namespace"}[2m])/120) by (status, function_name) | milvus_rootcoord_ddl_req_count | Le nombre total de requêtes DDL, y compris CreateCollection , DescribeCollection , DescribeSegments , HasCollection , ShowCollections , ShowPartitions , et ShowSegments . |
Temps de latence des requêtes DDL | La latence moyenne et le 99e percentile de la latence des requêtes DDL au cours des deux dernières minutes. | p99 : histogram_quantile(0.99, sum by (le, function_name) (rate(milvus_rootcoord_ddl_req_latency_bucket{app_kubernetes_io_instance=~"$instance", app_kubernetes_io_name="$app_name", namespace="$namespace"}[2m]))) avg : sum(increase(milvus_rootcoord_ddl_req_latency_sum{app_kubernetes_io_instance=~"$instance", app_kubernetes_io_name="$app_name", namespace="$namespace"}[2m])) by (function_name) / sum(increase(milvus_rootcoord_ddl_req_latency_count{app_kubernetes_io_instance=~"$instance", app_kubernetes_io_name="$app_name", namespace="$namespace"}[2m])) by (function_name) | milvus_rootcoord_ddl_req_latency | Le temps de latence de tous les types de requêtes DDL. |
Sync Timetick Latency (Temps de latence de la synchronisation) | La latence moyenne et le 99ème percentile du temps utilisé par root coord pour synchroniser tous les horodatages avec PChannel au cours des deux dernières minutes. | p99 : histogram_quantile(0.99, sum by (le) (rate(milvus_rootcoord_sync_timetick_latency_bucket{app_kubernetes_io_instance=~"$instance", app_kubernetes_io_name="$app_name", namespace="$namespace"}[2m]))) avg : sum(increase(milvus_rootcoord_sync_timetick_latency_sum{app_kubernetes_io_instance=~"$instance", app_kubernetes_io_name="$app_name", namespace="$namespace"}[2m])) / sum(increase(milvus_rootcoord_sync_timetick_latency_count{app_kubernetes_io_instance=~"$instance", app_kubernetes_io_name="$app_name", namespace="$namespace"}[2m])) | milvus_rootcoord_sync_timetick_latency | le temps utilisé par le coordonnateur principal pour synchroniser tous les horodatages avec le canal PC. |
ID Alloc Rate | Le nombre d'identifiants attribués par le coordinateur racine par seconde au cours des deux dernières minutes. | sum(increase(milvus_rootcoord_id_alloc_count{app_kubernetes_io_instance=~"$instance", app_kubernetes_io_name="$app_name", namespace="$namespace"}[2m])/120) | milvus_rootcoord_id_alloc_count | Le nombre cumulé d'identifiants attribués par le coordinateur racine. |
Horodatage | L'horodatage le plus récent du coordonnateur racine. | milvus_rootcoord_timestamp{app_kubernetes_io_instance=~"$instance", app_kubernetes_io_name="$app_name", namespace="$namespace"} | milvus_rootcoord_timestamp | Dernier horodatage de la coordonnée racine. |
Horodatage sauvegardé | Les horodatages pré-assignés que la racine de la coordination enregistre dans le méta stockage. | milvus_rootcoord_timestamp_saved{app_kubernetes_io_instance=~"$instance", app_kubernetes_io_name="$app_name", namespace="$namespace"} | milvus_rootcoord_timestamp_saved | Les horodatages pré-assignés que le coordonnateur racine enregistre dans le méta-mémoire. Les horodatages sont attribués 3 secondes plus tôt. L'horodatage est mis à jour et enregistré dans le méta-magasin toutes les 50 millisecondes. |
Collection Num | Le nombre total de collections. | sum(milvus_rootcoord_collection_num{app_kubernetes_io_instance=~"$instance", app_kubernetes_io_name="$app_name", namespace="$namespace"}) by (app_kubernetes_io_instance) | milvus_rootcoord_collection_num | Le nombre total de collections existant actuellement dans Milvus. |
Partition Num | Le nombre total de partitions. | sum(milvus_rootcoord_partition_num{app_kubernetes_io_instance=~"$instance", app_kubernetes_io_name="$app_name", namespace="$namespace"}) by (app_kubernetes_io_instance) | milvus_rootcoord_partition_num | Le nombre total de partitions existant actuellement dans Milvus. |
Canal DML Num | Le nombre total de canaux DML. | sum(milvus_rootcoord_dml_channel_num{app_kubernetes_io_instance=~"$instance", app_kubernetes_io_name="$app_name", namespace="$namespace"}) by (app_kubernetes_io_instance) | milvus_rootcoord_dml_channel_num | Le nombre total de canaux DML existant actuellement dans Milvus. |
Msgstream Num | Nombre total de flux de messages. | sum(milvus_rootcoord_msgstream_obj_num{app_kubernetes_io_instance=~"$instance", app_kubernetes_io_name="$app_name", namespace="$namespace"}) by (app_kubernetes_io_instance) | milvus_rootcoord_msgstream_obj_num | Le nombre total de flux de messages dans Milvus actuellement. |
Credential Num | Nombre total d'informations d'identification. | sum(milvus_rootcoord_credential_num{app_kubernetes_io_instance=~"$instance", app_kubernetes_io_name="$app_name", namespace="$namespace"}) by (app_kubernetes_io_instance) | milvus_rootcoord_credential_num | Le nombre total d'informations d'identification dans Milvus actuellement. |
Time Tick Delay | Somme des délais maximums des graphiques de flux sur tous les DataNodes et QueryNodes. | sum(milvus_rootcoord_time_tick_delay{app_kubernetes_io_instance=~"$instance", app_kubernetes_io_name="$app_name", namespace="$namespace"}) by (app_kubernetes_io_instance) | milvus_rootcoord_time_tick_delay | Le délai maximum des graphiques de flux sur chaque DataNode et QueryNode. |
Coordinateur de requête
Panneau | Description du panneau | PromQL (langage de requête Prometheus) | Les métriques Milvus utilisées | Description des métriques Milvus |
---|---|---|---|---|
Collection Loaded Num | Nombre de collections actuellement chargées en mémoire. | sum(milvus_querycoord_collection_num{app_kubernetes_io_instance=~"$instance", app_kubernetes_io_name="$app_name", namespace="$namespace"}) by (app_kubernetes_io_instance) | milvus_querycoord_collection_num | Nombre de collections actuellement chargées par Milvus. |
Entité chargée Num | Nombre d'entités actuellement chargées en mémoire. | sum(milvus_querycoord_entity_num{app_kubernetes_io_instance=~"$instance", app_kubernetes_io_name="$app_name", namespace="$namespace"}) by (app_kubernetes_io_instance) | milvus_querycoord_entitiy_num | Nombre d'entités actuellement chargées par Milvus. |
Taux de demande de chargement | Nombre de demandes de chargement par seconde au cours des deux dernières minutes. | sum(increase(milvus_querycoord_load_req_count{app_kubernetes_io_instance=~"$instance", app_kubernetes_io_name="$app_name", namespace="$namespace"}[2m])120) by (status) | milvus_querycoord_load_req_count | Nombre cumulé de demandes de chargement. |
Taux de demande de libération | Nombre de demandes de libération par seconde au cours des deux dernières minutes. | sum(increase(milvus_querycoord_release_req_count{app_kubernetes_io_instance=~"$instance", app_kubernetes_io_name="$app_name", namespace="$namespace"}[2m])/120) by (status) | milvus_querycoord_release_req_count | Nombre cumulé de demandes de libération. |
Temps de latence des demandes de chargement | La latence moyenne et le 99e percentile de la latence des demandes de chargement au cours des deux dernières minutes. | p99 : histogram_quantile(0.99, sum by (le) (rate(milvus_querycoord_load_latency_bucket{app_kubernetes_io_instance=~"$instance", app_kubernetes_io_name="$app_name", namespace="$namespace"}[2m]))) avg : sum(increase(milvus_querycoord_load_latency_sum{app_kubernetes_io_instance=~"$instance", app_kubernetes_io_name="$app_name", namespace="$namespace"}[2m])) / sum(increase(milvus_querycoord_load_latency_count{app_kubernetes_io_instance=~"$instance", app_kubernetes_io_name="$app_name", namespace="$namespace"}[2m])) | milvus_querycoord_load_latency | Temps nécessaire à l'exécution d'une demande de chargement. |
Latence de la demande de libération | Le temps de latence moyen et le 99ème percentile du temps de latence des demandes de libération au cours des deux dernières minutes. | p99 : histogram_quantile(0.99, sum by (le) (rate(milvus_querycoord_release_latency_bucket{app_kubernetes_io_instance=~"$instance", app_kubernetes_io_name="$app_name", namespace="$namespace"}[2m]))) moyenne : sum(increase(milvus_querycoord_release_latency_sum{app_kubernetes_io_instance=~"$instance", app_kubernetes_io_name="$app_name", namespace="$namespace"}[2m])) / sum(increase(milvus_querycoord_release_latency_count{app_kubernetes_io_instance=~"$instance", app_kubernetes_io_name="$app_name", namespace="$namespace"}[2m])) | milvus_querycoord_release_latency | Le temps nécessaire à l'exécution d'une demande de libération. |
Sub-Load Task | Nombre de tâches de sous-charge. | sum(milvus_querycoord_child_task_num{app_kubernetes_io_instance=~"$instance", app_kubernetes_io_name="$app_name", namespace="$namespace"}) by (app_kubernetes_io_instance) | milvus_querycoord_child_task_num | Nombre de tâches de sous-charge. Une coordonnée de requête divise une demande de charge en plusieurs tâches de charge secondaires. |
Tâche de charge principale | Nombre de tâches de chargement parent. | sum(milvus_querycoord_parent_task_num{app_kubernetes_io_instance=~"$instance", app_kubernetes_io_name="$app_name", namespace="$namespace"}) by (app_kubernetes_io_instance) | milvus_querycoord_parent_task_num | Nombre de sous-tâches de charge. Chaque demande de charge correspond à une tâche parent dans la file d'attente des tâches. |
Latence de la tâche de sous-charge | La latence moyenne et le 99e percentile de la latence d'une tâche de sous-charge au cours des deux dernières minutes. | p99 : histogram_quantile(0.99, sum by (le) (rate(milvus_querycoord_child_task_latency_bucket{app_kubernetes_io_instance=~"$instance", app_kubernetes_io_name="$app_name", namespace="$namespace"}[2m]))) avg : sum(increase(milvus_querycoord_child_task_latency_sum{app_kubernetes_io_instance=~"$instance", app_kubernetes_io_name="$app_name", namespace="$namespace"}[2m])) / sum(increase(milvus_querycoord_child_task_latency_count{app_kubernetes_io_instance=~"$instance", app_kubernetes_io_name="$app_name", namespace="$namespace"}[2m])) namespace"}[2m]))) | milvus_querycoord_child_task_latency | Temps d'attente pour terminer une tâche de sous-charge. |
Query Node Num | Nombre de nœuds de requête gérés par query coord. | sum(milvus_querycoord_querynode_num{app_kubernetes_io_instance=~"$instance", app_kubernetes_io_name="$app_name", namespace="$namespace"}) by (app_kubernetes_io_instance) | milvus_querycoord_querynode_num | Nombre de nœuds de requête gérés par la coordination des requêtes. |
Nœud de requête
Panneau | Description du panneau | PromQL (langage de requête Prometheus) | Les métriques Milvus utilisées | Description des métriques Milvus |
---|---|---|---|---|
Collection Loaded Num | Nombre de collections chargées en mémoire par chaque nœud de requête. | sum(milvus_querynode_collection_num{app_kubernetes_io_instance=~"$instance", app_kubernetes_io_name="$app_name", namespace="$namespace"}) by (pod, node_id) | milvus_querynode_collection_num | Nombre de collections chargées par chaque nœud de requête. |
Partition chargée Num | Nombre de partitions chargées en mémoire par chaque nœud d'interrogation. | sum(milvus_querynode_partition_num{app_kubernetes_io_instance=~"$instance", app_kubernetes_io_name="$app_name", namespace="$namespace"}) by (pod, node_id) | milvus_querynode_partition_num | Nombre de partitions chargées par chaque nœud d'interrogation. |
Segment chargé Num | Nombre de segments chargés en mémoire par chaque nœud d'interrogation. | sum(milvus_querynode_segment_num{app_kubernetes_io_instance=~"$instance", app_kubernetes_io_name="$app_name", namespace="$namespace"}) by (pod, node_id) | milvus_querynode_segment_num | Nombre de segments chargés par chaque nœud d'interrogation. |
Entité interrogeable Num | Nombre d'entités interrogeables et consultables sur chaque nœud d'interrogation. | sum(milvus_querynode_entity_num{app_kubernetes_io_instance=~"$instance", app_kubernetes_io_name="$app_name", namespace="$namespace"}) by (pod, node_id) | milvus_querynode_entity_num | Nombre d'entités interrogeables et consultables sur chaque nœud d'interrogation. |
Canal virtuel DML | Nombre de canaux virtuels DML surveillés par chaque nœud d'interrogation. | sum(milvus_querynode_dml_vchannel_num{app_kubernetes_io_instance=~"$instance", app_kubernetes_io_name="$app_name", namespace="$namespace"}) by (pod, node_id) | milvus_querynode_dml_vchannel_num | Nombre de canaux virtuels DML surveillés par chaque nœud d'interrogation. |
Canal virtuel Delta | Nombre de canaux delta surveillés par chaque nœud d'interrogation. | sum(milvus_querynode_delta_vchannel_num{app_kubernetes_io_instance=~"$instance", app_kubernetes_io_name="$app_name", namespace="$namespace"}) by (pod, node_id) | milvus_querynode_delta_vchannel_num | Nombre de canaux delta surveillés par chaque nœud de requête. |
Consumer Num | Nombre de consommateurs dans chaque noeud de requête. | sum(milvus_querynode_consumer_num{app_kubernetes_io_instance=~"$instance", app_kubernetes_io_name="$app_name", namespace="$namespace"}) by (pod, node_id) | milvus_querynode_consumer_num | Nombre de consommateurs dans chaque nœud de requête. |
Taux de requêtes de recherche | Nombre total de demandes de recherche et d'interrogation reçues par seconde par chaque nœud d'interrogation et nombre de demandes de recherche et d'interrogation réussies au cours des deux dernières minutes. | sum(increase(milvus_querynode_sq_req_count{app_kubernetes_io_instance=~"$instance", app_kubernetes_io_name="$app_name", namespace="$namespace"}[2m])/120) by (query_type, status, pod, node_id) | milvus_querynode_sq_req_count | Nombre cumulé de demandes de recherche et d'interrogation. |
Temps de latence des requêtes de recherche | La latence moyenne et le 99e percentile du temps utilisé pour les requêtes de recherche et d'interrogation par chaque nœud d'interrogation au cours des deux dernières minutes. Ce panneau affiche la latence des requêtes de recherche et d'interrogation dont l'état est "succès" ou "total". | p99 : histogram_quantile(0.99, sum by (le, pod, node_id) (rate(milvus_querynode_sq_req_latency_bucket{app_kubernetes_io_instance=~"$instance", app_kubernetes_io_name="$app_name", namespace="$namespace"}[2m]))) avg : sum(increase(milvus_querynode_sq_req_latency_sum{app_kubernetes_io_instance=~"$instance", app_kubernetes_io_name="$app_name", namespace="$namespace"}[2m])) by(pod, node_id, query_type) / sum(increase(milvus_querynode_sq_req_latency_count{app_kubernetes_io_instance=~"$instance", app_kubernetes_io_name="$app_name", namespace="$namespace"}[2m])) by(pod, node_id, query_type) | milvus_querynode_sq_req_latency | Temps de latence de la demande de recherche du nœud d'interrogation. |
Temps de latence de la recherche dans la file d'attente | Temps de latence moyen et 99e centile du temps de latence des requêtes de recherche et d'interrogation en file d'attente au cours des deux dernières minutes. | p99 : histogram_quantile(0.99, sum by (le, pod, node_id, query_type) (rate(milvus_querynode_sq_queue_latency_bucket{app_kubernetes_io_instance=~"$instance", app_kubernetes_io_name="$app_name", namespace="$namespace"}[2m]))) avg : sum(increase(milvus_querynode_sq_queue_latency_sum{app_kubernetes_io_instance=~"$instance", app_kubernetes_io_name="$app_name", namespace="$namespace"}[2m])) by(pod, node_id, query_type) / sum(increase(milvus_querynode_sq_queue_latency_count{app_kubernetes_io_instance=~"$instance", app_kubernetes_io_name="$app_name", namespace="$namespace"}[2m])) by(pod, node_id, query_type) | milvus_querynode_sq_queue_latency | Temps de latence des requêtes de recherche et d'interrogation reçues par le nœud d'interrogation. |
Temps de latence du segment de recherche | La latence moyenne et le 99e percentile du temps nécessaire à chaque nœud de requête pour rechercher et interroger un segment au cours des deux dernières minutes. L'état d'un segment peut être scellé ou en croissance. | p99 : histogram_quantile(0.99, sum by (le, query_type, segment_state, pod, node_id) (rate(milvus_querynode_sq_segment_latency_bucket{app_kubernetes_io_instance=~"$instance", app_kubernetes_io_name="$app_name", namespace="$namespace"}[2m]))) avg : sum(increase(milvus_querynode_sq_segment_latency_sum{app_kubernetes_io_instance=~"$instance", app_kubernetes_io_name="$app_name", namespace="$namespace"}[2m])) by(pod, node_id, query_type, segment_state) / sum(increase(milvus_querynode_sq_segment_latency_count{app_kubernetes_io_instance=~"$instance", app_kubernetes_io_name="$app_name", namespace="$namespace"}[2m])) by(pod, node_id, query_type, segment_state) | milvus_querynode_sq_segment_latency | Temps nécessaire à chaque nœud de requête pour rechercher et interroger chaque segment. |
Temps de latence des requêtes Segcore | Temps de latence moyen et 99e percentile du temps nécessaire à chaque nœud de requête pour effectuer une recherche et une requête dans le segcore au cours des deux dernières minutes. | p99 : histogram_quantile(0.99, sum by (le, query_type, pod, node_id) (rate(milvus_querynode_sq_core_latency_bucket{app_kubernetes_io_instance=~"$instance", app_kubernetes_io_name="$app_name", namespace="$namespace"}[2m]))) avg : sum(increase(milvus_querynode_sq_core_latency_sum{app_kubernetes_io_instance=~"$instance", app_kubernetes_io_name="$app_name", namespace="$namespace"}[2m])) by(pod, node_id, query_type) / sum(increase(milvus_querynode_sq_core_latency_count{app_kubernetes_io_instance=~"$instance", app_kubernetes_io_name="$app_name", namespace="$namespace"}[2m])) by(pod, node_id, query_type) | milvus_querynode_sq_core_latency | Temps nécessaire à chaque nœud de requête pour effectuer une recherche et une requête dans segcore. |
Temps de latence de la réduction de la recherche | Temps de latence moyen et 99e percentile du temps utilisé par chaque nœud de requête pendant l'étape de réduction d'une recherche ou d'une requête au cours des deux dernières minutes. | p99 : histogram_quantile(0.99, sum by (le, pod, node_id, query_type) (rate(milvus_querynode_sq_reduce_latency_bucket{app_kubernetes_io_instance=~"$instance", app_kubernetes_io_name="$app_name", namespace="$namespace"}[2m]))) avg : sum(increase(milvus_querynode_sq_reduce_latency_sum{app_kubernetes_io_instance=~"$instance", app_kubernetes_io_name="$app_name", namespace="$namespace"}[2m])) by(pod, node_id, query_type) / sum(increase(milvus_querynode_sq_reduce_latency_count{app_kubernetes_io_instance=~"$instance", app_kubernetes_io_name="$app_name", namespace="$namespace"}[2m])) by(pod, node_id, query_type) | milvus_querynode_sq_reduce_latency | Le temps que chaque requête passe pendant l'étape de réduction. |
Temps de latence du segment de charge | Temps de latence moyen et 99e percentile du temps nécessaire à chaque nœud de requête pour charger un segment au cours des deux dernières minutes. | p99 : histogram_quantile(0.99, sum by (le, pod, node_id) (rate(milvus_querynode_load_segment_latency_bucket{app_kubernetes_io_instance=~"$instance", app_kubernetes_io_name="$app_name", namespace="$namespace"}[2m]))) avg : sum(increase(milvus_querynode_load_segment_latency_sum{app_kubernetes_io_instance=~"$instance", app_kubernetes_io_name="$app_name", namespace="$namespace"}[2m])) by(pod, node_id) / sum(increase(milvus_querynode_load_segment_latency_count{app_kubernetes_io_instance=~"$instance", app_kubernetes_io_name="$app_name", namespace="$namespace"}[2m])) by(pod, node_id) | milvus_querynode_load_segment_latency_bucket | Temps nécessaire à chaque nœud de requête pour charger un segment. |
Flowgraph Num | Nombre d'organigrammes dans chaque nœud de requête. | sum(milvus_querynode_flowgraph_num{app_kubernetes_io_instance=~"$instance", app_kubernetes_io_name="$app_name", namespace="$namespace"}) by (pod, node_id) | milvus_querynode_flowgraph_num | Le nombre de diagrammes de flux dans chaque nœud d'interrogation. |
Longueur des tâches de lecture non résolues | Longueur de la file d'attente des demandes de lecture non résolues dans chaque nœud d'interrogation. | sum(milvus_querynode_read_task_unsolved_len{app_kubernetes_io_instance=~"$instance", app_kubernetes_io_name="$app_name", namespace="$namespace"}) by (pod, node_id) | milvus_querynode_read_task_unsolved_len | Longueur de la file d'attente des demandes de lecture non résolues. |
Longueur de la tâche de lecture prête | Longueur de la file d'attente des demandes de lecture à exécuter dans chaque nœud d'interrogation. | sum(milvus_querynode_read_task_ready_len{app_kubernetes_io_instance=~"$instance", app_kubernetes_io_name="$app_name", namespace="$namespace"}) by (pod, node_id) | milvus_querynode_read_task_ready_len | Longueur de la file d'attente des demandes de lecture à exécuter. |
Tâche de lecture parallèle (Parallel Read Task Num) | Nombre de requêtes de lecture simultanées actuellement exécutées dans chaque noeud de requête. | sum(milvus_querynode_read_task_concurrency{app_kubernetes_io_instance=~"$instance", app_kubernetes_io_name="$app_name", namespace="$namespace"}) by (pod, node_id) | milvus_querynode_read_task_concurrency | Le nombre de requêtes de lecture simultanées actuellement exécutées. |
Estimate CPU Usage | L'utilisation du CPU par chaque noeud de requête estimée par le planificateur. | sum(milvus_querynode_estimate_cpu_usage{app_kubernetes_io_instance=~"$instance", app_kubernetes_io_name="$app_name", namespace="$namespace"}) by (pod, node_id) | milvus_querynode_estimate_cpu_usage | L'utilisation du CPU par chaque noeud de requête estimée par le planificateur. Lorsque la valeur est de 100, cela signifie qu'un CPU virtuel (vCPU) entier est utilisé. |
Taille du groupe de recherche | Le nombre moyen et le 99e centile de la taille du groupe de recherche (c'est-à-dire le nombre total de requêtes de recherche originales dans les requêtes de recherche combinées exécutées par chaque nœud de requête) au cours des deux dernières minutes. | p99 : histogram_quantile(0.99, sum by (le, pod, node_id) (rate(milvus_querynode_search_group_size_bucket{app_kubernetes_io_instance=~"$instance", app_kubernetes_io_name="$app_name", namespace="$namespace"}[2m]))) avg : sum(increase(milvus_querynode_search_group_size_sum{app_kubernetes_io_instance=~"$instance", app_kubernetes_io_name="$app_name", namespace="$namespace"}[2m])) by(pod, node_id) / sum(increase(milvus_querynode_search_group_size_count{app_kubernetes_io_instance=~"$instance", app_kubernetes_io_name="$app_name", namespace="$namespace"}[2m])) by(pod, node_id) | milvus_querynode_load_segment_latency_bucket | Le nombre de tâches de recherche originales parmi les tâches de recherche combinées de différents ensembles (c.-à-d. la taille du groupe de recherche). |
Recherche NQ | Le nombre moyen et le 99e percentile du nombre de requêtes (NQ) effectuées lorsque chaque nœud de requête exécute des requêtes de recherche au cours des deux dernières minutes. | p99 : histogram_quantile(0.99, sum by (le, pod, node_id) (rate(milvus_querynode_search_group_size_bucket{app_kubernetes_io_instance=~"$instance", app_kubernetes_io_name="$app_name", namespace="$namespace"}[2m]))) avg : sum(increase(milvus_querynode_search_group_size_sum{app_kubernetes_io_instance=~"$instance", app_kubernetes_io_name="$app_name", namespace="$namespace"}[2m])) by(pod, node_id) / sum(increase(milvus_querynode_search_group_size_count{app_kubernetes_io_instance=~"$instance", app_kubernetes_io_name="$app_name", namespace="$namespace"}[2m])) by(pod, node_id) | Milvus_querynode_load_segment_latency_bucket | Le nombre de requêtes (NQ) des demandes de recherche. |
Groupe de recherche NQ | Le nombre moyen et le 99e centile du NQ des requêtes de recherche combinées et exécutées par chaque nœud de requête au cours des deux dernières minutes. | p99 : histogram_quantile(0.99, sum by (le, pod, node_id) (rate(milvus_querynode_search_group_nq_bucket{app_kubernetes_io_instance=~"$instance", app_kubernetes_io_name="$app_name", namespace="$namespace"}[2m]))) avg : sum(increase(milvus_querynode_search_group_nq_sum{app_kubernetes_io_instance=~"$instance", app_kubernetes_io_name="$app_name", namespace="$namespace"}[2m])) by(pod, node_id) / sum(increase(milvus_querynode_search_group_nq_count{app_kubernetes_io_instance=~"$instance", app_kubernetes_io_name="$app_name", namespace="$namespace"}[2m])) by(pod, node_id) | milvus_querynode_load_segment_latency_bucket | Le NQ des requêtes de recherche combinées à partir de différentes catégories. |
Recherche Top_K | Nombre moyen et 99e percentile de Top_K des demandes de recherche exécutées par chaque nœud d'interrogation au cours des deux dernières minutes. | p99 : histogram_quantile(0.99, sum by (le, pod, node_id) (rate(milvus_querynode_search_topk_bucket{app_kubernetes_io_instance=~"$instance", app_kubernetes_io_name="$app_name", namespace="$namespace"}[2m]))) avg : sum(increase(milvus_querynode_search_topk_sum{app_kubernetes_io_instance=~"$instance", app_kubernetes_io_name="$app_name", namespace="$namespace"}[2m])) by(pod, node_id) / sum(increase(milvus_querynode_search_topk_count{app_kubernetes_io_instance=~"$instance", app_kubernetes_io_name="$app_name", namespace="$namespace"}[2m])) by(pod, node_id) | milvus_querynode_load_segment_latency_bucket | Le Top_K des demandes de recherche. |
Groupe de recherche Top_K | Nombre moyen et 99e centile des Top_K demandes de recherche combinées et exécutées par chaque nœud d'interrogation au cours des deux dernières minutes. | p99 : histogram_quantile(0.99, sum by (le, pod, node_id) (rate(milvus_querynode_search_group_topk_bucket{app_kubernetes_io_instance=~"$instance", app_kubernetes_io_name="$app_name", namespace="$namespace"}[2m]))) avg : sum(increase(milvus_querynode_search_group_topk_sum{app_kubernetes_io_instance=~"$instance", app_kubernetes_io_name="$app_name", namespace="$namespace"}[2m])) by(pod, node_id) / sum(increase(milvus_querynode_search_group_topk_count{app_kubernetes_io_instance=~"$instance", app_kubernetes_io_name="$app_name", namespace="$namespace"}[2m])) by(pod, node_id) | milvus_querynode_load_segment_latency_bucket | Le Top_K des requêtes de recherche combinées à partir de différents ensembles. |
Taux de requêtes de lecture évincées | Nombre de demandes de lecture expulsées par seconde par chaque nœud d'interrogation au cours des deux dernières minutes. | sum(increase(milvus_querynode_read_evicted_count{app_kubernetes_io_instance=~"$instance", app_kubernetes_io_name="$app_name", namespace="$namespace"}[2m])/120) by (pod, node_id) | milvus_querynode_sq_req_count | Le nombre cumulé de requêtes de lecture évincées par le nœud d'interrogation en raison d'une restriction du trafic. |
Coordinateur de données
Panneau | Description du panel | PromQL (langage de requête Prometheus) | Les métriques Milvus utilisées | Description des métriques Milvus |
---|---|---|---|---|
Data Node Num | Nombre de nœuds de données gérés par le coordinateur des données. | sum(milvus_datacoord_datanode_num{app_kubernetes_io_instance=~"$instance", app_kubernetes_io_name="$app_name", namespace="$namespace"}) by (app_kubernetes_io_instance) | milvus_datacoord_datanode_num | Nombre de nœuds de données gérés par la coordinatrice des données. |
Segment Num | Nombre de tous les types de segments enregistrés dans les métadonnées par la coordination des données. | sum(milvus_datacoord_segment_num{app_kubernetes_io_instance=~"$instance", app_kubernetes_io_name="$app_name", namespace="$namespace"}) by (segment_state) | milvus_datacoord_segment_num | Nombre de tous les types de segments enregistrés dans les métadonnées par la coordonnatrice des données. Les types de segments sont les suivants : dropped, flushed, flushing, growing et sealed. |
Collection Num | Nombre de collections enregistrées dans les métadonnées par la coordonnatrice des données. | sum(milvus_datacoord_collection_num{app_kubernetes_io_instance=~"$instance", app_kubernetes_io_name="$app_name", namespace="$namespace"}) by (app_kubernetes_io_instance) | milvus_datacoord_collection_num | Nombre de collections enregistrées dans les métadonnées par la coordonnatrice des données. |
Lignes stockées | Nombre cumulé de lignes de données valides et effacées dans la coordonnée des données. | sum(milvus_datacoord_stored_rows_num{app_kubernetes_io_instance=~"$instance", app_kubernetes_io_name="$app_name", namespace="$namespace"}) by (app_kubernetes_io_instance) | milvus_datacoord_stored_rows_num | Nombre cumulé de lignes de données valides et effacées dans la coordonnée des données. |
Taux de lignes stockées | Nombre moyen de lignes extraites par seconde au cours des deux dernières minutes. | sum(increase(milvus_datacoord_stored_rows_count{app_kubernetes_io_instance=~"$instance", app_kubernetes_io_name="$app_name", namespace="$namespace"}[2m])/120) by (pod, node_id) | milvus_datacoord_stored_rows_count | Le nombre cumulé de lignes extraites par la coordonnée des données. |
Temps de synchronisation | Le nombre moyen, maximum et minimum de temps de synchronisation par coordonnée de données dans chaque canal physique. | avg(milvus_datacoord_sync_epoch_time{app_kubernetes_io_instance=~"$instance", app_kubernetes_io_name="$app_name", namespace="$namespace"}) by (app_kubernetes_io_instance) max(milvus_datacoord_sync_epoch_time{app_kubernetes_io_instance=~"$instance", app_kubernetes_io_name="$app_name", namespace="$namespace"}) by (app_kubernetes_io_instance) min(milvus_datacoord_sync_epoch_time{app_kubernetes_io_instance=~"$instance", app_kubernetes_io_name="$app_name", namespace="$namespace"}) by (app_kubernetes_io_instance) | milvus_datacoord_sync_epoch_time | L'heure de référence de chaque canal physique (heure Unix, millisecondes écoulées depuis le 1er janvier 1970). |
Taille du journal stocké | Taille totale du journal stocké. | sum(milvus_datacoord_stored_binlog_size{app_kubernetes_io_instance=~"$instance", app_kubernetes_io_name="$app_name", namespace="$namespace"}) by (app_kubernetes_io_instance) | milvus_datacoord_stored_binlog_size | Taille totale du journal stocké dans Milvus. |
Nœud de données
Panneau | Description du panneau | PromQL (langage de requête Prometheus) | Les métriques Milvus utilisées | Description des métriques Milvus |
---|---|---|---|---|
Flowgraph Num | Nombre d'objets de l'organigramme correspondant à chaque nœud de données. | sum(milvus_datanode_flowgraph_num{app_kubernetes_io_instance=~"$instance", app_kubernetes_io_name="$app_name", namespace="$namespace"}) by (pod, node_id) | milvus_datanode_flowgraph_num | Nombre d'objets de graphe de flux. Chaque tesson d'une collection correspond à un objet de graphe de flux. |
Msg Rows Consume Rate | Nombre de lignes de messages en continu consommées par seconde par chaque nœud de données au cours des deux dernières minutes. | sum(increase(milvus_datanode_msg_rows_count{app_kubernetes_io_instance=~"$instance", app_kubernetes_io_name="$app_name", namespace="$namespace"}[2m])/120) by (msg_type, pod, node_id) | milvus_datanode_msg_rows_count | Nombre de lignes de messages en continu consommées. Actuellement, les messages en continu comptabilisés par nœud de données ne comprennent que les messages d'insertion et de suppression. |
Taux de taille des données de vidange | La taille de chaque message de vidange enregistrée par seconde par chaque nœud de données au cours des deux dernières minutes. | sum(increase(milvus_datanode_flushed_data_size{app_kubernetes_io_instance=~"$instance", app_kubernetes_io_name="$app_name", namespace="$namespace"}[2m])/120) by (msg_type, pod, node_id) | milvus_datanode_flushed_data_size | La taille de chaque message envoyé. Actuellement, les messages en continu comptabilisés par nœud de données ne comprennent que les messages d'insertion et de suppression. |
Consumer Num | Nombre de consommateurs créés sur chaque nœud de données. | sum(milvus_datanode_consumer_num{app_kubernetes_io_instance=~"$instance", app_kubernetes_io_name="$app_name", namespace="$namespace"}) by (pod, node_id) | milvus_datanode_consumer_num | Nombre de consommateurs créés sur chaque nœud de données. Chaque organigramme correspond à un consommateur. |
Producer Num | Nombre de producteurs créés sur chaque nœud de données. | sum(milvus_datanode_producer_num{app_kubernetes_io_instance=~"$instance", app_kubernetes_io_name="$app_name", namespace="$namespace"}) by (pod, node_id) | milvus_datanode_producer_num | Nombre de consommateurs créés sur chaque nœud de données. Chaque tesson d'une collection correspond à un producteur de canal delta et à un producteur de canal timetick. |
Sync Time | Nombre moyen, maximum et minimum de temps d'époque synchronisés par chaque nœud de données dans tous les thèmes physiques. | avg(milvus_datanode_sync_epoch_time{app_kubernetes_io_instance=~"$instance", app_kubernetes_io_name="$app_name", namespace="$namespace"}) by (pod, node_id) max(milvus_datanode_sync_epoch_time{app_kubernetes_io_instance=~"$instance", app_kubernetes_io_name="$app_name", namespace="$namespace"}) by (pod, node_id) min(milvus_datanode_sync_epoch_time{app_kubernetes_io_instance=~"$instance", app_kubernetes_io_name="$app_name", namespace="$namespace"}) by (pod, node_id) | milvus_datanode_sync_epoch_time | L'heure d'origine (heure Unix, millisecondes écoulées depuis le 1er janvier 1970) de chaque sujet physique sur un noeud de données. |
Unflushed Segment Num | Nombre de segments non vidés créés sur chaque noeud de données. | sum(milvus_datanode_unflushed_segment_num{app_kubernetes_io_instance=~"$instance", app_kubernetes_io_name="$app_name", namespace="$namespace"}) by (pod, node_id) | milvus_datanode_unflushed_segment_num | Nombre de segments non vidés créés sur chaque nœud de données. |
Encode Buffer Latency | La latence moyenne et le 99e percentile du temps utilisé pour encoder un tampon par chaque nœud de données au cours des deux dernières minutes. | p99 : histogram_quantile(0.99, sum by (le, pod, node_id) (rate(milvus_datanode_encode_buffer_latency_bucket{app_kubernetes_io_instance=~"$instance", app_kubernetes_io_name="$app_name", namespace="$namespace"}[2m]))) avg : sum(increase(milvus_datanode_encode_buffer_latency_sum{app_kubernetes_io_instance=~"$instance", app_kubernetes_io_name="$app_name", namespace="$namespace"}[2m])) by(pod, node_id) / sum(increase(milvus_datanode_encode_buffer_latency_count{app_kubernetes_io_instance=~"$instance", app_kubernetes_io_name="$app_name", namespace="$namespace"}[2m])) by(pod, node_id) | milvus_datanode_encode_buffer_latency | Temps nécessaire à chaque nœud de données pour encoder une mémoire tampon. |
Sauvegarde de la latence des données | Temps de latence moyen et 99e percentile du temps utilisé pour écrire un tampon dans la couche de stockage par chaque nœud de données au cours des deux dernières minutes. | p99 : histogram_quantile(0.99, sum by (le, pod, node_id) (rate(milvus_datanode_save_latency_bucket{app_kubernetes_io_instance=~"$instance", app_kubernetes_io_name="$app_name", namespace="$namespace"}[2m]))) avg : sum(increase(milvus_datanode_save_latency_sum{app_kubernetes_io_instance=~"$instance", app_kubernetes_io_name="$app_name", namespace="$namespace"}[2m])) by(pod, node_id) / sum(increase(milvus_datanode_save_latency_count{app_kubernetes_io_instance=~"$instance", app_kubernetes_io_name="$app_name", namespace="$namespace"}[2m])) by(pod, node_id) | milvus_datanode_save_latency | Temps nécessaire à chaque nœud de données pour écrire un tampon dans la couche de stockage. |
Taux d'opération de rinçage | Nombre de fois où chaque nœud de données vide une mémoire tampon par seconde au cours des deux dernières minutes. | sum(increase(milvus_datanode_flush_buffer_op_count{app_kubernetes_io_instance=~"$instance", app_kubernetes_io_name="$app_name", namespace="$namespace"}[2m])/120) by (status, pod, node_id) | milvus_datanode_flush_buffer_op_count | Nombre cumulé de fois qu'un nœud de données vide une mémoire tampon. |
Taux d'opération de vidange automatique | Nombre de fois où chaque nœud de données a procédé à une vidange automatique de la mémoire tampon par seconde au cours des deux dernières minutes. | sum(increase(milvus_datanode_autoflush_buffer_op_count{app_kubernetes_io_instance=~"$instance", app_kubernetes_io_name="$app_name", namespace="$namespace"}[2m])/120) by (status, pod, node_id) | milvus_datanode_autoflush_buffer_op_count | Nombre cumulé de fois qu'un nœud de données vide automatiquement une mémoire tampon. |
Taux de demande de vidange | Nombre de fois où chaque nœud de données reçoit une demande de vidange de la mémoire tampon par seconde au cours des deux dernières minutes. | sum(increase(milvus_datanode_flush_req_count{app_kubernetes_io_instance=~"$instance", app_kubernetes_io_name="$app_name", namespace="$namespace"}[2m])/120) by (status, pod, node_id) | milvus_datanode_flush_req_count | Nombre cumulé de fois où un noeud de données reçoit une demande de vidange de la part d'une coordonnée. |
Latence de compactage | La latence moyenne et le percentile 99 du temps nécessaire à chaque nœud de données pour exécuter une tâche de compactage au cours des deux dernières minutes. | p99 : histogram_quantile(0.99, sum by (le, pod, node_id) (rate(milvus_datanode_compaction_latency_bucket{app_kubernetes_io_instance=~"$instance", app_kubernetes_io_name="$app_name", namespace="$namespace"}[2m]))) avg : sum(increase(milvus_datanode_compaction_latency_sum{app_kubernetes_io_instance=~"$instance", app_kubernetes_io_name="$app_name", namespace="$namespace"}[2m])) by(pod, node_id) / sum(increase(milvus_datanode_compaction_latency_count{app_kubernetes_io_instance=~"$instance", app_kubernetes_io_name="$app_name", namespace="$namespace"}[2m])) by(pod, node_id) | milvus_datanode_compaction_latency | Le temps nécessaire à chaque nœud de données pour exécuter une tâche de compactage. |
Coordinateur de l'index
Panneau | Description du panel | PromQL (langage de requête Prometheus) | Les métriques Milvus utilisées | Description des métriques Milvus |
---|---|---|---|---|
Taux de demande d'index | Nombre moyen de demandes de construction d'index reçues par seconde au cours des deux dernières minutes. | sum(increase(milvus_indexcoord_indexreq_count{app_kubernetes_io_instance=~"$instance", app_kubernetes_io_name="$app_name", namespace="$namespace"}[2m])/120) by (status) | milvus_indexcoord_indexreq_count | Nombre de demandes de construction d'index reçues. |
Nombre de tâches d'indexation | Nombre de tâches d'indexation enregistrées dans les métadonnées d'index. | sum(milvus_indexcoord_indextask_count{app_kubernetes_io_instance=~"$instance", app_kubernetes_io_name="$app_name", namespace="$namespace"}) by (index_task_status) | milvus_indexcoord_indextask_count | Nombre de tâches d'indexation enregistrées dans les métadonnées d'index. |
Index Node Num | Nombre de nœuds d'index gérés. | sum(milvus_indexcoord_indexnode_num{app_kubernetes_io_instance=~"$instance", app_kubernetes_io_name="$app_name", namespace="$namespace"}) by (app_kubernetes_io_instance) | milvus_indexcoord_indexnode_num | Nombre de nœuds d'index gérés. |
Nœud d'index
Panneau | Description du panneau | PromQL (langage de requête Prometheus) | Les métriques Milvus utilisées | Description des métriques Milvus |
---|---|---|---|---|
Taux de tâches d'indexation | Nombre moyen de tâches de construction d'index reçues par chaque nœud d'index par seconde au cours des deux dernières minutes. | sum(increase(milvus_indexnode_index_task_count{app_kubernetes_io_instance=~"$instance", app_kubernetes_io_name="$app_name", namespace="$namespace"}[2m])/120) by (status, pod, node_id) | milvus_indexnode_index_task_count | Nombre de tâches de construction d'index reçues. |
Latence du champ de charge | La latence moyenne et le 99e percentile du temps utilisé par chaque nœud d'index pour charger les données de champ de segment à chaque fois au cours des deux dernières minutes. | p99 : histogram_quantile(0.99, sum by (le, pod, node_id) (rate(milvus_indexnode_load_field_latency_bucket{app_kubernetes_io_instance=~"$instance", app_kubernetes_io_name="$app_name", namespace="$namespace"}[2m]))) avg : sum(increase(milvus_indexnode_load_field_latency_sum{app_kubernetes_io_instance=~"$instance", app_kubernetes_io_name="$app_name", namespace="$namespace"}[2m])) by(pod, node_id) / sum(increase(milvus_indexnode_load_field_latency_count{app_kubernetes_io_instance=~"$instance", app_kubernetes_io_name="$app_name", namespace="$namespace"}[2m])) by(pod, node_id) | milvus_indexnode_load_field_latency | Temps utilisé par le nœud d'index pour charger les données du champ de segment. |
Temps de latence du champ de décodage | Temps de latence moyen et 99e percentile du temps utilisé par chaque nœud d'index pour encoder les données de champ à chaque fois au cours des deux dernières minutes. | p99 : histogram_quantile(0.99, sum by (le, pod, node_id) (rate(milvus_indexnode_decode_field_latency_bucket{app_kubernetes_io_instance=~"$instance", app_kubernetes_io_name="$app_name", namespace="$namespace"}[2m]))) avg : sum(increase(milvus_indexnode_decode_field_latency_sum{app_kubernetes_io_instance=~"$instance", app_kubernetes_io_name="$app_name", namespace="$namespace"}[2m])) by(pod, node_id) / sum(increase(milvus_indexnode_decode_field_latency_count{app_kubernetes_io_instance=~"$instance", app_kubernetes_io_name="$app_name", namespace="$namespace"}[2m])) by(pod, node_id) | milvus_indexnode_decode_field_latency | Le temps utilisé pour décoder les données de champ. |
Temps de latence de l'index de construction | Temps de latence moyen et 99e percentile du temps utilisé par chaque nœud d'index pour construire les index au cours des deux dernières minutes. | p99 : histogram_quantile(0.99, sum by (le, pod, node_id) (rate(milvus_indexnode_build_index_latency_bucket{app_kubernetes_io_instance=~"$instance", app_kubernetes_io_name="$app_name", namespace="$namespace"}[2m]))) avg : sum(increase(milvus_indexnode_build_index_latency_sum{app_kubernetes_io_instance=~"$instance", app_kubernetes_io_name="$app_name", namespace="$namespace"}[2m])) by(pod, node_id) / sum(increase(milvus_indexnode_build_index_latency_count{app_kubernetes_io_instance=~"$instance", app_kubernetes_io_name="$app_name", namespace="$namespace"}[2m])) by(pod, node_id) | milvus_indexnode_build_index_latency | Le temps utilisé pour construire les index. |
Temps de latence de l'index d'encodage | Temps de latence moyen et 99e percentile du temps utilisé par chaque nœud d'index pour encoder les fichiers d'index au cours des deux dernières minutes. | p99 : histogram_quantile(0.99, sum by (le, pod, node_id) (rate(milvus_indexnode_encode_index_latency_bucket{app_kubernetes_io_instance=~"$instance", app_kubernetes_io_name="$app_name", namespace="$namespace"}[2m]))) avg : sum(increase(milvus_indexnode_encode_index_latency_sum{app_kubernetes_io_instance=~"$instance", app_kubernetes_io_name="$app_name", namespace="$namespace"}[2m])) by(pod, node_id) / sum(increase(milvus_indexnode_encode_index_latency_count{app_kubernetes_io_instance=~"$instance", app_kubernetes_io_name="$app_name", namespace="$namespace"}[2m])) by(pod, node_id) | milvus_indexnode_encode_index_latency | Le temps utilisé pour encoder les fichiers d'index. |
Sauvegarder la latence de l'index | Temps de latence moyen et 99e percentile du temps utilisé par chaque nœud d'index pour enregistrer les fichiers d'index au cours des deux dernières minutes. | p99 : histogram_quantile(0.99, sum by (le, pod, node_id) (rate(milvus_indexnode_save_index_latency_bucket{app_kubernetes_io_instance=~"$instance", app_kubernetes_io_name="$app_name", namespace="$namespace"}[2m]))) avg : sum(increase(milvus_indexnode_save_index_latency_sum{app_kubernetes_io_instance=~"$instance", app_kubernetes_io_name="$app_name", namespace="$namespace"}[2m])) by(pod, node_id) / sum(increase(milvus_indexnode_save_index_latency_count{app_kubernetes_io_instance=~"$instance", app_kubernetes_io_name="$app_name", namespace="$namespace"}[2m])) by(pod, node_id) | milvus_indexnode_save_index_latency | Temps utilisé pour enregistrer les fichiers d'index. |