為 Milvus 服務建立警報
本主題介紹 Milvus 服務的警示機制,並解釋為何、何時及如何在 Milvus 中建立警示。
透過建立警示,當特定指標的值超過您預先定義的臨界值時,您可以收到通知。
例如,您創建一個警報,並設定 80 MB 為 Milvus 元件記憶體使用的最大值。如果實際使用量超過預先定義的數字,您將收到警報,提醒您 Milvus 元件的記憶體使用量超過 80 MB。收到警報後,您可以相應地及時調整資源分配,以確保服務的可用性。
建立警報的情況
以下是一些您需要建立警報的常見情況。
- Milvus 元件的 CPU 或記憶體使用率過高。
- Milvus 元件 pod 的磁碟空間不足。
- Milvus 元件 pod 重新啟動的頻率太高。
下列指標可用於警示設定:
公制 | 說明 | 測量單位 |
---|---|---|
CPU 使用量 | Milvus 元件的 CPU 使用量,由 CPU 的運行時間顯示。 | 秒 |
記憶體 | Milvus 元件消耗的記憶體資源。 | MB |
動畫 | 在 GO 語言中同時執行的活動。 | / |
作業系統線程 | 線程或作業系統中的輕量級進程。 | / |
已開啟的進程檔案 | 目前使用的檔案描述符數量。 | / |
設定警報
本指南以建立 Milvus 元件記憶體使用警示為例。若要建立其他類型的警示,請相應調整您的指令。如果您在過程中遇到任何問題,請隨時到Milvus 論壇詢問或在Slack 上啟動討論。
先決條件
本教學假設您已安裝和設定 Grafana。如果沒有,建議閱讀監控指南。
1.新增查詢
要為 Milvus 元件的記憶體使用量新增警示,請編輯記憶體面板。然後,新增一個包含 metric 的新查詢:process_resident_memory_bytes{app_kubernetes_io_name="milvus", app_kubernetes_io_instance=~"my-release", namespace="default"}
Alert_metric
2.儲存儀表板
儲存儀表板,等待幾分鐘就可以看到警示。
警報儀表板
Grafana 警報查詢不支援範本變數。因此,您應該在標籤中加入第二個不含任何範本變數的查詢。第二個查詢預設命名為「A」。您可以按一下下拉式選單來重新命名。
警報查詢
3.新增警示通知
若要接收警示通知,請新增「通知頻道」。然後,在欄位「傳送至」中指定頻道。
警報通知
如果成功建立並觸發警報,您會收到如下截圖所示的通知。
通知訊息
若要刪除警報,請移至「警報」面板,然後按一下刪除按鈕。
刪除警報
下一步
- 如果您需要開始監控 Milvus 的服務:
- 如果您已經為 Milvus 元件的記憶體使用創建了警報:
- 學習如何分配資源
- 如果您正在尋找關於如何擴展 Milvus 叢集的資訊:
- 了解如何擴充 Milvus 叢集