2021 年的 Milvus - 年度回顾
对于 Milvus 这个开源项目来说,2021 年是令人惊叹的一年。我想借此机会感谢 Milvus 的所有贡献者和用户,以及合作伙伴,感谢他们为如此出色的一年做出的贡献。
今年给我留下最深刻印象的时刻之一是 Milvus 2.0 的发布。在我们开始这个项目之前,只有少数社区成员相信我们能提供世界上最先进的向量数据库,但现在我可以自豪地说,Milvus 2.0 GA 已经可以投入生产了。
我们已经在为 2022 年迎接一系列令人兴奋的新挑战而努力,但我认为庆祝一下我们去年迈出的几大步会很有趣。以下是其中几项:
社区发展
首先,这里有一份来自 GitHub 和 Slack 的社区统计摘要。截至 2021 年 12 月底:
贡献者从 2020 年 12 月的 121人增加到 2021 年 12 月的 209人(增长 172)
星级从 2020 年 12 月的 4828 个增加到 2021 年 12 月的 9090 个(增长 188)
叉子从 2020 年 12 月的 756 个增加到 2021 年 12 月的 1383 个(增长 182)
Slack 成员从 2020 年 12 月的 541 人增加到 2021 年 12 月的 1233 人(增长 227)
img
社区管理与宣传
2019 年 10 月 Milvus 首次开源时,我们的团队和社区规模都比较小,因此项目自然主要由几个核心团队成员进行治理。但从那时起,社区有了显著的发展,我们意识到需要一个更好的系统来管理项目,这样才能更有效地欢迎新的贡献者。
因此,我们在 2021 年任命了 5 位新的维护者,负责跟踪正在进行的工作和报告的问题,确保它们得到及时审查和合并。这五位维护者的 GitHub ID 分别是:@栾小凡;@丛其霞;@scsven;@czs007;@闫亮567。如果您的 PR 需要帮助,请随时联系这些维护者。
我们还启动了Milvus 倡导者计划,欢迎更多的人加入我们,分享你的经验,为社区成员提供帮助,并获得认可作为回报。
图片
(图片:Milvus GitHub 贡献者,使用 dynamicwebpaige 的项目制作 )
Milvus 项目公告和里程碑
- 版本发布数:14
- Milvus 2.0.0 GA 支持的 SDK
PyMilvus (可用)
Go SDK(可用)
Java SDK(可用)
Node.js SDK(可用)
C++ SDK(开发中)
- 推出新的 Milvus 工具:
- Milvus_CLI(Milvus 命令行)
- Attu(Milvus 管理图形用户界面)
- Milvus K8s 操作符
社区活动
今年,我们主办和参加了许多活动,使我们的全球社区成员能够在当前 Covid-19 的情况下会面(主要是虚拟会面)。我们总共参加和主办了 21 次会议:
- 6 次技术会议
- 7 次 Milvus 办公时间
- 34 次网络研讨会
- 3 次线下聚会
我们计划在 2022 年举办更多活动。如果您想参加附近的活动,请查看社区论坛中的 "活动和聚会"类别,了解即将举办的活动及其地点。如果您想成为我们未来活动的发言人或主持人,请通过community@milvus.io 联系我们。
展望 2022 年--路线图和公告
社区:
- 完善 Milvus 项目成员资格,吸引/选举更多维护者和提交者,共同建设社区。
- 启动导师计划,为希望加入社区并做出贡献的新人提供更多帮助。
- 改善社区文档管理,包括技术文档、用户指南和社区文档。2022 年,希望我们的社区成员能一起完成《Milvus 手册》,让大家更好地学习如何使用 Milvus。
- 加强与其他开源社区的合作与互动,包括上游人工智能社区以及 Milvus 依赖的 Kubernetes、MinIO、etcd 和 Pulsar 等社区。
- 通过召开更多定期的 SIG 会议,变得更加社区化。除了目前正在运行的 SIG-pymilvus,我们计划在 2022 年成立更多的 SIG。
Milvus 项目:
- 性能调整
卓越的性能一直是用户选择 Milvus 的重要原因。2022 年,我们计划启动性能优化项目,将吞吐量和延迟至少提高一倍。我们还计划引入内存复制来提高吞吐量和小数据集下的系统稳定性,并支持 GPU 来加速索引构建和在线服务。
- 功能
Milvus 2.0 已经支持向量/标量混合搜索、实体删除和时间旅行等功能。我们计划在下两个主要版本中支持以下功能:
- 支持更丰富的数据类型:字符串、Blob、地理空间等。
- 基于角色的访问控制
- 主键重复数据删除
- 支持向量上的范围搜索(距离 < 0.8 时的搜索)
- 支持有源 API 和其他语言 SDK
- 易用性
未来一年,我们计划开发多种工具,帮助更好地部署和管理 Milvus。
Milvus up: 这是一个部署组件,可帮助用户在没有 K8s 集群的离线环境中启动 Milvus。它还有助于部署监控、跟踪和其他 Milvus 开发。
Attu - 我们将继续改进我们的集群管理系统 Attu。我们计划增加健康诊断和索引优化等功能。
Milvus DM:数据迁移工具,用于将向量从其他数据库或文件迁移到 Milvus。我们将首先支持 FAISS、HNSW、Milvus 1.0/2.0,然后支持 MySQL 和 Elasticsearch 等其他数据库。
关于作者
栾晓帆,Zilliz合伙人兼工程总监,LF人工智能与数据基金会技术顾问委员会成员。曾先后就职于甲骨文美国总部和软件定义存储创业公司Hedvig。他曾加入阿里巴巴云数据库团队,负责 NoSQL 数据库 HBase 和 Lindorm 的开发。栾先生拥有康奈尔大学电子计算机工程硕士学位。
Try Managed Milvus for Free
Zilliz Cloud is hassle-free, powered by Milvus and 10x faster.
Get StartedLike the article? Spread the word