🚀 免費嘗試 Zilliz Cloud,完全托管的 Milvus,體驗速度提升 10 倍!立即嘗試

milvus-logo
LFAI
主頁
  • 管理指南
    • 監控、警示與日誌
  • Home
  • Docs
  • 管理指南

  • 監控、警示與日誌

  • 警報

  • 建立警報

為 Milvus 服務建立警報

本主題介紹 Milvus 服務的警示機制,並解釋為何、何時及如何在 Milvus 中建立警示。

透過建立警示,當特定指標的值超過您預先定義的臨界值時,您可以收到通知。

例如,您創建一個警報,並設定 80 MB 為 Milvus 元件記憶體使用的最大值。如果實際使用量超過預先定義的數字,您將收到警報,提醒您 Milvus 元件的記憶體使用量超過 80 MB。收到警報後,您可以相應地及時調整資源分配,以確保服務的可用性。

建立警報的情況

以下是一些您需要建立警報的常見情況。

  • Milvus 元件的 CPU 或記憶體使用率過高。
  • Milvus 元件 pod 的磁碟空間不足。
  • Milvus 元件 pod 重新啟動的頻率太高。

下列指標可用於警示設定:

公制說明測量單位
CPU 使用量Milvus 元件的 CPU 使用量,由 CPU 的運行時間顯示。
記憶體Milvus 元件消耗的記憶體資源。MB
動畫在 GO 語言中同時執行的活動。/
作業系統線程線程或作業系統中的輕量級進程。/
已開啟的進程檔案目前使用的檔案描述符數量。/

設定警報

本指南以建立 Milvus 元件記憶體使用警示為例。若要建立其他類型的警示,請相應調整您的指令。如果您在過程中遇到任何問題,請隨時到Milvus 論壇詢問或在Slack 上啟動討論。

先決條件

本教學假設您已安裝和設定 Grafana。如果沒有,建議閱讀監控指南

1.新增查詢

要為 Milvus 元件的記憶體使用量新增警示,請編輯記憶體面板。然後,新增一個包含 metric 的新查詢:process_resident_memory_bytes{app_kubernetes_io_name="milvus", app_kubernetes_io_instance=~"my-release", namespace="default"}

Alert_metric Alert_metric

2.儲存儀表板

儲存儀表板,等待幾分鐘就可以看到警示。

Alert_dashboard 警報儀表板

Grafana 警報查詢不支援範本變數。因此,您應該在標籤中加入第二個不含任何範本變數的查詢。第二個查詢預設命名為「A」。您可以按一下下拉式選單來重新命名。

Alert_query 警報查詢

3.新增警示通知

若要接收警示通知,請新增「通知頻道」。然後,在欄位「傳送至」中指定頻道。

Alert_notification 警報通知

如果成功建立並觸發警報,您會收到如下截圖所示的通知。

Notification_message 通知訊息

若要刪除警報,請移至「警報」面板,然後按一下刪除按鈕。

Delete_alert 刪除警報

下一步

免費嘗試托管的 Milvus

Zilliz Cloud 無縫接入,由 Milvus 提供動力,速度提升 10 倍。

開始使用
反饋

這個頁面有幫助嗎?