Milvus 2.3.4:更快的搜索、更大的数据支持、更好的监控等
我们很高兴发布最新的 Milvus 2.3.4 版本。此次更新引入了一系列精心设计的功能和增强功能,以优化性能、提高效率并提供无缝的用户体验。在这篇博文中,我们将深入探讨 Milvus 2.3.4 的亮点。
改进监控的访问日志
Milvus 现在支持访问日志,为了解与外部接口的交互提供了宝贵的信息。这些日志记录了方法名称、用户请求、响应时间、错误代码和其他交互信息,使开发人员和系统管理员能够进行性能分析、安全审计和高效的故障排除。
注: 目前,访问日志仅支持 gRPC 交互。不过,我们将继续致力于改进,未来版本将扩展此功能,以包括 RESTful 请求日志。
有关详细信息,请参阅配置访问日志。
通过 Parquet 文件导入提高数据处理效率
Milvus 2.3.4 现在支持导入 Parquet 文件,这是一种广受欢迎的列式存储格式,旨在提高大规模数据集的存储和处理效率。这一新增功能提高了用户处理数据的灵活性和效率。通过省去费力的数据格式转换,管理 Parquet 格式大型数据集的用户将体验到简化的数据导入流程,大大缩短从初始数据准备到后续向量检索的时间。
此外,我们的数据格式转换工具 BulkWriter 现在已将 Parquet 作为其默认输出数据格式,确保为开发人员提供更直观的体验。
在不断增长的数据段上建立 Binlog 索引,加快搜索速度
Milvus 现在可在不断增长的数据段上利用 binlog 索引,从而将不断增长的数据段中的搜索速度提高 10 倍。这一改进大大提高了搜索效率,并支持 IVF 或快速扫描等高级索引,从而改善了整体用户体验。
支持多达 10,000 个 Collections/分区
与关系数据库中的表和分区一样,Collections 和分区是 Milvus 中存储和管理向量数据的核心单元。为了满足用户对细微数据组织不断变化的需求,Milvus 2.3.4 现在支持一个集群中多达 10,000 个 Collections/分区,与之前的 4,096 个限制相比有了大幅提升。这一改进有利于知识库管理和多租户环境等各种使用案例。对 Collections/分区支持的扩大源于对时间刻度机制、"程序 "管理和内存使用的改进。
注意: 建议将 Collections/partition 的数量限制为 10,000 个,因为超过这一限制可能会影响故障恢复和资源使用。
其他增强功能
除上述功能外,Milvus 2.3.4 还包括各种改进和错误修复。这些改进包括降低数据检索和变长数据处理过程中的内存使用率、改进错误消息传递、加快加载速度以及改进查询分片平衡。这些 Collections 增强功能有助于实现更流畅、更高效的整体用户体验。
如需全面了解 Milvus 2.3.4 中引入的所有更改,请参阅我们的发行说明。
保持联系!
如果您有关于 Milvus 的问题或反馈,请加入我们的Discord 频道,直接与我们的工程师和社区交流,或参加每周二下午 12:12:30 的Milvus 社区午餐学习会。也欢迎您在Twitter或LinkedIn上关注我们,了解有关 Milvus 的最新消息和更新。
- 改进监控的访问日志
- 通过 Parquet 文件导入提高数据处理效率
- 在不断增长的数据段上建立 Binlog 索引,加快搜索速度
- 支持多达 10,000 个 Collections/分区
- 其他增强功能
- 保持联系!
On This Page
Try Managed Milvus for Free
Zilliz Cloud is hassle-free, powered by Milvus and 10x faster.
Get StartedLike the article? Spread the word