Milvusサービスのアラート作成
このトピックでは、Milvusサービスのアラートメカニズムを紹介し、Milvusでアラートを作成する理由、タイミング、方法について説明します。
アラートを作成することで、特定のメトリックの値が事前に定義したしきい値を超えた場合に通知を受け取ることができます。
例えば、アラートを作成し、Milvusコンポーネントによるメモリ使用量の最大値として80MBを設定します。実際の使用量が事前に定義した数値を超えた場合、Milvus コンポーネントのメモリ使用量が 80 MB を超えたことを通知するアラートが表示されます。このアラートを受けて、リソースの割り当てを適宜調整し、サービスの可用性を確保することができます。
アラート作成のシナリオ
以下は、アラートを作成する必要がある一般的なシナリオです。
- MilvusコンポーネントのCPUまたはメモリの使用率が高すぎる。
- Milvusコンポーネントポッドのディスク容量が不足している。
- Milvusコンポーネントポッドの再起動頻度が高すぎる。
アラート設定で使用できるメトリックは次のとおりです:
メトリック | メトリック | 測定単位 |
---|---|---|
CPU使用率 | MilvusコンポーネントによるCPU使用率で、CPUの実行時間で示されます。 | 秒 |
メモリ | Milvusコンポーネントが消費するメモリリソース。 | MB |
ゴルーチン | GO言語での同時実行アクティビティ。 | / |
OSスレッド | OSのスレッド、または軽量プロセス。 | / |
プロセスオープンFds | 現在使用されているファイルディスクリプタの数。 | / |
アラートの設定
本ガイドでは、Milvusコンポーネントのメモリ使用量に関するアラートを作成することを例にしています。他の種類のアラートを作成する場合は、適宜コマンドを調整してください。作業中に問題が発生した場合は、Milvusフォーラムで質問するか、Slackでディスカッションを開始してください。
前提条件
このチュートリアルでは、Grafana がインストールされ、設定されていることを前提としています。そうでない場合は、モニタリングガイドを読むことをお勧めします。
1.新しいクエリを追加する
Milvusコンポーネントのメモリ使用量のアラートを追加するには、Memoryパネルを編集します。次に、メトリックで新しいクエリを追加します:process_resident_memory_bytes{app_kubernetes_io_name="milvus", app_kubernetes_io_instance=~"my-release", namespace="default"}
アラートメトリック
2.ダッシュボードを保存する
ダッシュボードを保存し、アラートが表示されるまで数分待ちます。
アラート_ダッシュボード
Grafana アラートクエリはテンプレート変数をサポートしていません。そのため、ラベルにテンプレート変数を含まない2つ目のクエリを追加する必要があります。2つ目のクエリはデフォルトで「A」という名前になっています。ドロップダウンをクリックして名前を変更できます。
Alert_query
3.アラート通知の追加
アラート通知を受信するには、"通知チャンネル "を追加します。次に、"Send to "フィールドでチャンネルを指定します。
アラート通知
アラートが正常に作成され、トリガーされると、以下のスクリーンショットのような通知が届きます。
通知_メッセージ
アラートを削除するには、"Alert "パネルに移動し、削除ボタンをクリックします。
アラートの削除
次のステップ
- Milvusのモニタリングサービスを開始する必要がある場合:
- Milvusコンポーネントのメモリ使用量に関するアラートを作成した場合: リソースの割り当て方法を学ぶ
- Milvusクラスタのスケール方法について情報をお探しの場合: