操作常见问题
如果我无法从 Docker Hub 提取 Milvus Docker 镜像怎么办?
如果从 Docker Hub 拉取 Milvus Docker 镜像失败,请尝试添加其他注册镜像。
中国大陆的用户可以在/etc.docker/daemon.json 中的 registry-mirrors 数组中添加网址 "https://registry.docker-cn.com"。
{
"registry-mirrors": ["https://registry.docker-cn.com"]
}
Docker 是安装和运行 Milvus 的唯一方式吗?
Docker 是部署 Milvus 的有效方法,但不是唯一的方法。你也可以从源代码部署 Milvus。这需要 Ubuntu(18.04 或更高版本)或 CentOS(7 或更高版本)。更多信息,请参阅从源代码构建 Milvus。
影响召回率的主要因素是什么?
召回率主要受索引类型和搜索参数的影响。
对于 FLAT 索引,Milvus 在集合内进行穷举扫描,100% 返回。
对于 IVF 索引,nprobe 参数决定了在集合内的搜索范围。增加 nprobe 会增加搜索向量的比例和召回率,但会降低查询性能。
对于 HNSW 索引,ef 参数决定图搜索的广度。增加 ef 会增加在图上搜索的点数和召回率,但会降低查询性能。
有关详细信息,请参阅向量索引。
为什么我对配置文件的修改没有生效?
Milvus 不支持在运行期间修改配置文件。必须重新启动 Milvus Docker,配置文件的更改才能生效。
我如何知道 Milvus 是否已成功启动?
如果使用 Docker Compose 启动 Milvus,请运行docker ps
观察有多少 Docker 容器在运行,并检查 Milvus 服务是否正确启动。
对于单机版 Milvus,你应该至少能观察到三个正在运行的 Docker 容器,其中一个是 Milvus 服务,另外两个是 etcd 管理和存储服务。更多信息,请参阅安装 Milvus 单机版。
为什么日志文件中的时间与系统时间不同?
时间不同通常是由于主机不使用协调世界时(UTC)。
Docker 映像中的日志文件默认使用 UTC。如果您的主机不使用 UTC,可能会出现这个问题。
我如何知道我的 CPU 是否支持 Milvus?
Milvus 的计算操作取决于 CPU 对 SIMD(单指令、多数据)扩展指令集的支持。您的中央处理器是否支持 SIMD 扩展指令集对 Milvus 中的索引构建和向量相似性搜索至关重要。确保 CPU 至少支持以下一种 SIMD 指令集:
- SSE4.2
- AVX
- AVX2
- AVX512
运行 lscpu 命令检查 CPU 是否支持上述 SIMD 指令集:
$ lscpu | grep -e sse4_2 -e avx -e avx2 -e avx512
为什么 Milvus 在启动时返回illegal instruction
?
Milvus 要求 CPU 支持 SIMD 指令集:SSE4.2、AVX、AVX2 或 AVX512。CPU 必须至少支持其中之一,以确保 Milvus 正常运行。启动过程中返回的illegal instruction
错误说明 CPU 不支持上述四种指令集中的任何一种。
我可以在 Windows 上安装 Milvus 吗?
可以。你可以通过源代码编译或二进制包在 Windows 上安装 Milvus。
请参阅在 Windows 上运行 Milvus了解如何在 Windows 上安装 Milvus。
我在 Windows 上安装 pymilvus 时出错了。我该怎么办?
不建议在 Windows 上安装 PyMilvus。但如果您必须在 Windows 上安装 PyMilvus,却发现了错误,请尝试在Conda环境中安装。有关如何在 Conda 环境中安装PyMilvus的详细信息,请参阅安装 Milvus SDK。
断开网络连接后还能部署 Milvus 吗?
可以。您可以在离线环境中安装 Milvus。更多信息,请参阅离线安装 Milvus。
在哪里可以找到 Milvus 生成的日志?
Milvus 日志默认打印到 stout(标准输出)和 stderr(标准错误),但我们强烈建议在生产中将日志重定向到持久卷。为此,请更新milvus.yaml 中的log.file.rootPath
。如果使用milvus-helm
图表部署 Milvus,还需要先通过--set log.persistence.enabled=true
启用日志持久性。
如果你没有更改配置,使用 kubectl logs <pod-name> 或 docker logs CONTAINER 也能帮你找到日志。
在插入数据之前,我可以为段创建索引吗?
可以。但我们建议在为每个数据段创建索引之前,分批插入数据,每批不应超过 256 MB。
能否在多个 Milvus 实例之间共享一个 etcd 实例?
可以,你可以在多个 Milvus 实例之间共享一个 etcd 实例。为此,在启动每个 Milvus 实例之前,需要在每个实例的配置文件中将etcd.rootPath
更改为单独的值。
能否在多个 Milvus 实例之间共享一个 Pulsar 实例?
可以,你可以在多个 Milvus 实例之间共享一个 Pulsar 实例。为此,你可以
- 如果你的 Pulsar 实例启用了多租户,考虑为每个 Milvus 实例分配一个单独的租户或命名空间。为此,需要在启动 Milvus 实例之前,将其配置文件中的
pulsar.tenant
或pulsar.namespace
改为每个实例的唯一值。 - 如果不打算在 Pulsar 实例上启用多租户功能,请考虑在启动 Milvus 实例之前,将其配置文件中的
msgChannel.chanNamePrefix.cluster
更改为每个实例的唯一值。
我可以在多个 Milvus 实例之间共享 MinIO 实例吗?
可以,您可以在多个 Milvus 实例之间共享 MinIO 实例。为此,您需要在启动每个 Milvus 实例之前,在每个实例的配置文件中将minio.rootPath
更改为唯一值。
如何处理pymilvus.exceptions.ConnectionConfigException: <ConnectionConfigException: (code=1, message=Illegal uri: [example.db], expected form 'https://user:pwd@example.com:12345')>
错误信息?
错误信息Illegal uri [example.db]
表明你正在尝试使用早期版本的 PyMilvus 连接 Milvus Lite,而早期版本的 PyMilvus 不支持这种连接类型。要解决这个问题,请将 PyMilvus 升级到至少 2.4.2 版本,该版本支持连接 Milvus Lite。
您可以使用以下命令升级 PyMilvus:
pip install pymilvus>=2.4.2
为什么我得到的结果少于我在搜索/查询中设置的limit
?
有几种原因可能导致您收到的结果少于您指定的limit
:
数据有限:集合中可能没有足够的实体来满足您要求的限制。如果集合中的实体总数少于限制,您收到的结果自然会减少。
主键重复:在搜索过程中遇到主键重复时,Milvus 会优先处理特定实体。这种行为根据搜索类型而有所不同:
查询(完全匹配):Milvus 选择具有匹配 PK 的最新实体。 ANN 搜索:即使实体共享相同的 PK,Milvus 也会选择相似度得分最高的实体。 如果您的集合有很多重复的主键,这种优先级可能会导致唯一结果少于限制。
匹配不足:您的搜索过滤表达式可能过于严格,导致符合相似性阈值的实体较少。如果为搜索设置的条件过于严格,匹配的实体就不够多,导致结果比预期的少。
还有问题?
可以: