疑難排解
本頁列出運行 Milvus 時可能發生的常見問題,以及可能的故障排除提示。本頁面的問題分為以下幾類:
開機問題
開機錯誤通常是致命的。執行下列指令可檢視錯誤的詳細資訊:
$ docker logs <your milvus container id>
運行時問題
運行期間發生的錯誤可能會導致服務癱瘓。若要排除此問題,請先檢查伺服器與用戶端的相容性,然後再繼續進行。
API 問題
這些問題發生在 Milvus 伺服器和您的用戶端之間的 API 方法呼叫期間。它們會同步或非同步地傳回給用戶端。
etcd 崩潰問題
1. etcd pod 待定
etcd 集群預設使用 pvc。StorageClass 需要為 Kubernetes 叢集預先設定。
2. etcd pod 崩溃
當 etcd pod 崩潰時,Error: bad member ID arg (strconv.ParseUint: parsing "": invalid syntax), expecting ID in Hex ,您可以登入此 pod 並刪除/bitnami/etcd/data/member_id 檔案。
3.當etcd-0 仍在執行時,多個 Pod 持續當機
如果多個 Pod 在etcd-0 仍在執行時持續當機,您可以執行下列程式碼。
kubectl scale sts <etcd-sts> --replicas=1
# delete the pvc for etcd-1 and etcd-2
kubectl scale sts <etcd-sts> --replicas=3
4.所有 pod 都當機
當所有 pod 都當機時,請嘗試複製/bitnami/etcd/data/member/snap/db 檔案。使用https://github.com/etcd-io/bbolt 修改資料庫資料。
所有 Milvus 元資料都保存在key 資料桶中。備份此資料桶中的資料,並執行下列指令。請注意,by-dev/meta/session 檔案中的前綴資料不需要備份。
kubectl kubectl scale sts <etcd-sts> --replicas=0
# delete the pvc for etcd-0, etcd-1, etcd-2
kubectl kubectl scale sts <etcd-sts> --replicas=1
# restore the backup data
如果您需要協助解決問題,請隨時
- 加入我們的Discord 頻道,尋求 Milvus 團隊的支援。
- 在 GitHub 上提交問題,並詳細說明您的問題。