トラブルシューティング
このページでは、Milvusの実行時に発生する可能性のある一般的な問題と、考えられるトラブルシューティングのヒントを示します。このページの問題は以下のカテゴリに分類されます:
ブートの問題
ブートエラーは通常、致命的なものです。次のコマンドを実行して、エラーの詳細を表示する:
$ docker logs <your milvus container id>
ランタイムの問題
ランタイム中に発生したエラーにより、サービスが停止することがあります。この問題をトラブルシューティングするには、先に進む前にサーバーとクライアントの互換性を確認してください。
APIの問題
これらの問題はMilvusサーバとクライアント間のAPIメソッド呼び出し中に発生します。同期または非同期でクライアントに返されます。
etcd クラッシュ問題
1. etcdポッドの保留
etcdクラスタはデフォルトでpvcを使用します。StorageClassはKubernetesクラスタ用に事前に設定する必要があります。
2. etcdポッドのクラッシュ
etcd podがError: bad member ID arg (strconv.ParseUint: parsing "": invalid syntax), expecting ID in Hex
、クラッシュした場合、このpodにログインし、/bitnami/etcd/data/member_id
ファイルを削除することができます。
3.etcd-0
の実行中に複数のポッドがクラッシュし続ける。
etcd-0
の実行中に複数のポッドがクラッシュし続ける場合は、以下のコードを実行する。
kubectl scale sts <etcd-sts> --replicas=1
# delete the pvc for etcd-1 and etcd-2
kubectl scale sts <etcd-sts> --replicas=3
4.すべてのポッドがクラッシュする
すべてのポッドがクラッシュしたら、/bitnami/etcd/data/member/snap/db
ファイルをコピーしてみてください。https://github.com/etcd-io/bbolt
を使ってデータベースデータを変更してください。
Milvusのメタデータはすべてkey
バケットに保存されています。このバケット内のデータをバックアップし、以下のコマンドを実行してください。なお、by-dev/meta/session
ファイル内のプレフィックスデータはバックアップの必要はありません。
kubectl kubectl scale sts <etcd-sts> --replicas=0
# delete the pvc for etcd-0, etcd-1, etcd-2
kubectl kubectl scale sts <etcd-sts> --replicas=1
# restore the backup data
問題解決に助けが必要な場合は、遠慮なくどうぞ:
- Slack チャンネルに参加し、Milvus チームからのサポートを受ける。
- GitHub に問題の詳細を含むIssue を提出する。