Milvus 路線圖

邁向新一代多模式資料庫和資料湖

Milvus 產品路線圖

歡迎來到 Milvus 路線圖!

我們正將 Milvus 帶入一個新時代 - 新世代多模式資料庫 - 涵蓋結構化資料到非結構化資料即時擷取到離線分析單一集群效能到全球資料湖架構

本路線圖概述Milvus v2.6(進行中)Milvus v3.0(目標於 2026 年底)Milvus v3.1(長期開發)的核心目標,以及Vector Lake(資料湖 / Loon)的演進計畫。

Milvus v2.6 (進行中)

時間表:2025 年中 - 2025 年底

重點:升級資料模型重構串流架構建立冷熱分層功能,以及推出Vector Lake 原型 (v0.1)

主要亮點

資料模型升級

  • 引入統一的Tensor / StructList資料類型,以支援多向量嵌入結構,使其能與ColBERTCoLQwen視訊多模態向量相容。

  • 新增Geo Data支援,包括點、區域和空間索引 (基於libspatial),以擴充 LBS 和 GIS 的使用案例。

  • 支援含時區資料類型的Timestamp

StreamNode 架構重構

  • 重寫串流擷取管道,以最佳化增量寫入與即時計算。

  • 大幅提升並發效能與穩定性,為統一即時與離線處理奠定基礎。

  • 引入新的訊息佇列引擎:Woodpecker

🔹熱/冷分層與儲存架構 (StorageV2)

  • 支援雙儲存格式:ParquetVortex,增強了並發性和記憶體效率。

  • 以自動冷熱資料分離和智慧型排程實施分層儲存。

向量湖原型 (v0.1)

  • 透過 FFI 與Spark/DuckDB/DataFusion整合,實現離線模式演進和 KNN 查詢。

  • 提供多模式資料可視化和 Spark ETL 示範,建立基礎資料湖架構。

Milvus v3.0(預定於 2026 年初推出)

時間線:2025 年底 - 2026 年初

重點:全面強化搜尋體驗模式彈性非結構化資料支援,同時推出Vector Lake (v0.2)

主要亮點

🔹搜尋體驗徹底改變

  • 引入More Like This (MLT)類似性搜尋,支援包含位置或負面範例的搜尋。

  • 新增語意搜尋功能,例如高亮顯示強化

  • 支援自訂字典同義詞表,在 Analyzer 層支援詞彙和語義規則定義。

  • 為查詢引入聚合功能。

多租戶與資源管理

  • 啟用多租戶刪除、統計和冷/熱分層。

  • 改善資源隔離與排程策略,以支援單一叢集中的數百萬個資料表。

模式與主金鑰增強功能

  • 實施全局主金鑰重複資料刪除 (Global PK Dedup),以保證資料的一致性和唯一性。

  • 支援彈性的模式管理(新增/刪除欄位、備份填充)。

  • 允許向量欄位的NULL 值

擴充的非結構化資料類型 (BLOB / 文字)

  • 引入BLOB 類型,為檔案、影像和視訊等二進位資料提供本機儲存和引用。

  • 引入TEXT 類型,提供增強的全文和基於內容的搜尋功能。

🔹企業級功能

  • 支援以快照為基礎的備份與復原

  • 提供端對端追蹤稽核記錄

  • 在多群集部署中執行主動備用高可用性 (HA)

Vector Lake (v0.2)

  • 支援TEXT / BLOB 儲存多版本快照管理

  • 整合 Spark 以執行離線索引、群集、重複資料刪除及降維工作。

  • 提供ChatPDF 冷查詢和離線基準演示

Milvus v3.1 (長期願景)

時間線:2026 年中

重點:使用者定義函式 (UDF)分散式運算整合標量查詢最佳化動態分片,以及正式釋出Vector Lake (v1.0)

主要焦點

🔹UDF 與分散式運算生態系統

  • 支援使用者定義函式 (UDF),允許開發人員將自訂邏輯注入擷取與計算工作流程。

  • Ray Dataset / Daft深度整合,以進行分散式 UDF 執行與多模式資料處理。

標量查詢與本地格式演進

  • 最佳化標量欄位的篩選與聚合效能。

  • 增強表達式評估和索引加速執行。

  • 支援本機檔案格式的就地更新

進階搜尋功能

  • 新增下列功能:RankByOrderByFacet模糊匹配查詢。

  • 增強文字擷取,支援

    • match_phrase_prefix

    • Completion Suggester

    • Term Suggester

    • Phrase Suggester

動態分片與擴充能力

  • 啟用自動分片負載平衡,實現無縫擴充。

  • 改善全局索引建置,確保分散式搜尋效能

Vector Lake V1.0

  • Ray / Daft / PyTorch深度整合,以支援分散式 UDF 和 Context Engineering 用例。

  • 提供RAG(Retrieval-Augmented Generation)演示 ,並從 Iceberg 表匯入

共同打造 Milvus 的未來

Milvus 是由全球開發人員社群驅動的開放原始碼專案。

我們熱烈邀請所有社群成員協助塑造下一代的多模態資料庫:

  • 分享回饋:提出新功能或最佳化構想

  • 🐛回報問題:透過 GitHub Issues 歸檔錯誤

  • 🔧貢獻程式碼:提交 PR 並協助建立核心功能

    • 拉取請求:直接貢獻至我們的程式碼庫。無論是修正錯誤、新增功能或改善文件,我們都歡迎您的貢獻。

    • 開發指南:查看我們的貢獻者指南,瞭解有關代碼貢獻的指引。

  • 傳播訊息:分享最佳實作與成功案例

👉GitHub: milvus-io/milvus