Milvus 路線圖
邁向新一代多模式資料庫和資料湖
Milvus 產品路線圖
歡迎來到 Milvus 路線圖!
我們正將 Milvus 帶入一個新時代 - 新世代多模式資料庫 - 涵蓋結構化資料到非結構化資料、即時擷取到離線分析、單一集群效能到全球資料湖架構。
本路線圖概述Milvus v2.6(進行中)、Milvus v3.0(目標於 2026 年底)和Milvus v3.1(長期開發)的核心目標,以及Vector Lake(資料湖 / Loon)的演進計畫。
Milvus v2.6 (進行中)
時間表:2025 年中 - 2025 年底
重點:升級資料模型、重構串流架構、建立冷熱分層功能,以及推出Vector Lake 原型 (v0.1)。
主要亮點
資料模型升級
引入統一的Tensor / StructList資料類型,以支援多向量嵌入結構,使其能與ColBERT、CoLQwen、視訊和多模態向量相容。
新增Geo Data支援,包括點、區域和空間索引 (基於libspatial),以擴充 LBS 和 GIS 的使用案例。
支援含時區資料類型的Timestamp。
StreamNode 架構重構
重寫串流擷取管道,以最佳化增量寫入與即時計算。
大幅提升並發效能與穩定性,為統一即時與離線處理奠定基礎。
引入新的訊息佇列引擎:Woodpecker。
🔹熱/冷分層與儲存架構 (StorageV2)
支援雙儲存格式:Parquet和Vortex,增強了並發性和記憶體效率。
以自動冷熱資料分離和智慧型排程實施分層儲存。
向量湖原型 (v0.1)
透過 FFI 與Spark/DuckDB/DataFusion整合,實現離線模式演進和 KNN 查詢。
提供多模式資料可視化和 Spark ETL 示範,建立基礎資料湖架構。
Milvus v3.0(預定於 2026 年初推出)
時間線:2025 年底 - 2026 年初
重點:全面強化搜尋體驗、模式彈性和非結構化資料支援,同時推出Vector Lake (v0.2)。
主要亮點
🔹搜尋體驗徹底改變
引入More Like This (MLT)類似性搜尋,支援包含位置或負面範例的搜尋。
新增語意搜尋功能,例如高亮顯示和強化。
支援自訂字典和同義詞表,在 Analyzer 層支援詞彙和語義規則定義。
為查詢引入聚合功能。
多租戶與資源管理
啟用多租戶刪除、統計和冷/熱分層。
改善資源隔離與排程策略,以支援單一叢集中的數百萬個資料表。
模式與主金鑰增強功能
實施全局主金鑰重複資料刪除 (Global PK Dedup),以保證資料的一致性和唯一性。
支援彈性的模式管理(新增/刪除欄位、備份填充)。
允許向量欄位的NULL 值。
擴充的非結構化資料類型 (BLOB / 文字)
引入BLOB 類型,為檔案、影像和視訊等二進位資料提供本機儲存和引用。
引入TEXT 類型,提供增強的全文和基於內容的搜尋功能。
🔹企業級功能
支援以快照為基礎的備份與復原。
提供端對端追蹤與稽核記錄。
在多群集部署中執行主動備用高可用性 (HA)。
Vector Lake (v0.2)
支援TEXT / BLOB 儲存與多版本快照管理。
整合 Spark 以執行離線索引、群集、重複資料刪除及降維工作。
提供ChatPDF 冷查詢和離線基準演示。
Milvus v3.1 (長期願景)
時間線:2026 年中
重點:使用者定義函式 (UDF)、分散式運算整合、標量查詢最佳化、動態分片,以及正式釋出Vector Lake (v1.0)。
主要焦點
🔹UDF 與分散式運算生態系統
支援使用者定義函式 (UDF),允許開發人員將自訂邏輯注入擷取與計算工作流程。
與Ray Dataset / Daft深度整合,以進行分散式 UDF 執行與多模式資料處理。
標量查詢與本地格式演進
最佳化標量欄位的篩選與聚合效能。
增強表達式評估和索引加速執行。
支援本機檔案格式的就地更新。
進階搜尋功能
新增下列功能:RankBy、OrderBy、Facet 及模糊匹配查詢。
增強文字擷取,支援
match_phrase_prefixCompletion SuggesterTerm SuggesterPhrase Suggester
動態分片與擴充能力
啟用自動分片和負載平衡,實現無縫擴充。
改善全局索引建置,確保分散式搜尋效能。
Vector Lake V1.0
與Ray / Daft / PyTorch深度整合,以支援分散式 UDF 和 Context Engineering 用例。
提供RAG(Retrieval-Augmented Generation)演示 ,並從 Iceberg 表匯入。
共同打造 Milvus 的未來
Milvus 是由全球開發人員社群驅動的開放原始碼專案。
我們熱烈邀請所有社群成員協助塑造下一代的多模態資料庫:
分享回饋:提出新功能或最佳化構想
🐛回報問題:透過 GitHub Issues 歸檔錯誤
🔧貢獻程式碼:提交 PR 並協助建立核心功能
⭐傳播訊息:分享最佳實作與成功案例
👉GitHub: milvus-io/milvus