在 GKE 上部署 Milvus 集群
Milvus 是云原生向量数据库,可部署在各种云环境中。本指南将指导你了解在谷歌云平台(GCP)上设置 Milvus 的每个细节。
在 GCP 上部署 Milvus 集群
要在 GCP 上部署 Milvus,请确保
您的 GCP 账户中已存在一个项目。
您已在本地安装了gcloud CLI、kubectl 和Helm,或者决定使用基于浏览器的Cloud Shell。
您已使用 GCP 账户凭据初始化了 gcloud CLI。
为确保 milvus 安全,您需要在 GCP 项目中创建一个逻辑隔离的虚拟网络。下面的命令创建了一个 VPC。
gcloud compute networks create milvus-network \
--project=milvus-testing-nonprod \
--subnet-mode=auto \
--mtu=1460 \
为方便工作,还需要设置几条防火墙规则,以允许通过 ICMP、RDP 和 SSH 的外部流量以及 VPC 内的流量。
gcloud compute firewall-rules create milvus-network-allow-icmp \
--project=milvus-testing-nonprod \
--network=projects/milvus-testing-nonprod/global/networks/milvus-network \
--description="Allows ICMP connections from any source to any instance on the network." \
--direction=INGRESS \
--priority=65534 \
--source-ranges= \
--action=ALLOW \
gcloud compute firewall-rules create milvus-network-allow-internal \
--project=milvus-testing-nonprod \
--network=projects/milvus-testing-nonprod/global/networks/milvus-network \
--description="Allows connections from any source in the network IP range to any instance on the network using all protocols." \
--direction=INGRESS \
--priority=65534 \
--source-ranges= \
--action=ALLOW --rules=all
gcloud compute firewall-rules create milvus-network-allow-rdp \
--project=milvus-testing-nonprod \
--network=projects/milvus-testing-nonprod/global/networks/milvus-network \
--description="Allows RDP connections from any source to any instance on the network using port 3389." \
--direction=INGRESS \
--priority=65534 \
--source-ranges= \
--action=ALLOW \
gcloud compute firewall-rules create milvus-network-allow-ssh \
--project=milvus-testing-nonprod \
--network=projects/milvus-testing-nonprod/global/networks/milvus-network \
--description="Allows TCP connections from any source to any instance on the network using port 22." \
--direction=INGRESS \
--priority=65534 \
--source-ranges= \
--action=ALLOW \
最后,你需要允许传入我们稍后将在19530 端口创建的 Milvus 实例的流量。
gcloud compute firewall-rules create allow-milvus-in \
--project=milvus-testing-nonprod \
--description="Allow ingress traffic for Milvus on port 19530" \
--direction=INGRESS \
--priority=1000 \
--network=projects/milvus-testing-nonprod/global/networks/milvus-network \
--action=ALLOW \
--rules=tcp:19530 \
配置 Kubernetes 集群
在本指南中,我们将使用谷歌 Kubernetes 引擎(GKE)服务在us-west1-a区域配置一个有两个节点的 Kubernetes 集群。每个节点都是运行COS_CONTAINERD映像的e2-standard-4计算引擎虚拟机。
建议使用内存至少为 16 GB 的机器类型,以确保服务的稳定性。
gcloud container clusters create "milvus-cluster-1" \
--project "milvus-testing-nonprod" \
--zone "us-west1-a" \
--workload-pool "milvus-testing-nonprod.svc.id.goog" \
--no-enable-basic-auth \
--cluster-version "1.28.10-gke.1075001" \
--release-channel "regular" \
--machine-type "c2-standard-4" \
--image-type "COS_CONTAINERD" \
--disk-type "pd-standard" \
--disk-size "100" \
--max-pods-per-node "110" \
--num-nodes "3" \
--enable-ip-alias \
--network "projects/milvus-testing-nonprod/global/networks/milvus-network" \
--subnetwork "projects/milvus-testing-nonprod/regions/us-west1/subnetworks/milvus-network"
Kubernetes 集群启动需要几分钟时间。集群准备就绪后,使用以下命令获取其凭据,以便在终端运行kubectl
gcloud container clusters get-credentials milvus-cluster-1 --zone "us-west1-a"
使用 Google Cloud Storage (GCS) 作为外部对象存储
- 创建存储桶。
gcloud storage buckets create gs://milvus-testing-nonprod --project=milvus-testing-nonprod --default-storage-class=STANDARD --location=us-west1 --uniform-bucket-level-access
- 生成用户访问密钥和秘钥,然后进入项目的存储页面。在仪表板的左侧边栏,单击 Google Cloud Storage,然后单击 Settings(设置)。选择 INTEROPERABILITY 选项卡。如果尚未启用,请单击互操作访问。然后单击 "创建密钥 "按钮创建。
用户账户的 GCP 访问密钥
- 添加 values.yaml
enabled: true
type: LoadBalancer
enabled: false
enabled: true
host: storage.googleapis.com
port: 443
rootPath: milvus/my-release
bucketName: milvus-testing-nonprod
cloudProvider: gcp
useSSL: true
accessKey: "<access-key>"
secretKey: "<secret-key>"
部署 Milvus
现在 Kubernetes 集群已经准备就绪。让我们现在就部署 Milvus。
helm repo add milvus https://zilliztech.github.io/milvus-helm/
helm repo update
helm install -f values.yaml my-release milvus/milvus
在前面的命令中,我们在本地添加 Milvus Helm 图表的 repo,并更新 repo 以获取最新图表。然后,我们安装一个 Milvus 实例,并将其命名为my-release。
的值,它表明我们希望通过第四层负载平衡器公开 Milvus 实例。
如果你想通过 Layer-7 负载均衡器公开 Milvus 实例,请阅读此文。
所有 pod 运行后,运行以下命令获取外部 IP 地址。
kubectl get services|grep my-release-milvus|grep LoadBalancer|awk '{print $4}'
你好 Milvus
请参考Hello Milvus,将 host 值更改为外部 IP 地址,然后运行代码。
如果你想了解如何在其他云上部署 Milvus: