Milvus ロードマップ
🌌 次世代のマルチモーダルデータベースとデータレイクに向けて
Milvus製品ロードマップ
Milvusロードマップへようこそ!
構造化データから非構造化データまで、リアルタイム検索からオフライン分析まで、シングルクラスタのパフォーマンスからグローバルデータレイクアーキテクチャまで、Milvusは次世代マルチモーダルデータベースという新たな時代に突入します。
このロードマップは、Milvus v2.6(進行中)、Milvus v3.0(2026年後半を目標)、Milvus v3.1(長期開発)の中核目標の概要と、Vector Lake(データレイク/Loon)の進化計画を示しています。
🧩 Milvus v2.6 (進行中)
タイムライン2025年半ば~2025年末
フォーカスデータモデルのアップグレード、ストリーミングアーキテクチャのリファクタリング、ホット/コールドティアリング機能の構築、ベクターレイクプロトタイプ(v0.1)のローンチ。
主なハイライト
データモデルのアップグレード
マルチベクトル埋め込み構造をサポートする統一されたTensor / StructListデータ型を導入し、ColBERT、CoLQwen、ビデオ、マルチモーダルベクトルとの互換性を実現。
ポイント、リージョン、空間インデックス(libspatialベース)を含むGeo Dataサポートを追加し、LBSやGISでのユースケースを拡大。
Timestamp with Timezoneデータ型のサポート。
🔹 StreamNode アーキテクチャのリファクタリング
ストリーミング・インジェスト・パイプラインを書き換えて、増分書き込みとリアルタイム計算を最適化。
同時実行のパフォーマンスと安定性を大幅に改善し、リアルタイムとオフラインの統合処理の基礎を築く。
新しいメッセージキュー・エンジンを導入:ウッドペッカー
ホット/コールド・ティアリングとストレージ・アーキテクチャ (StorageV2)
デュアル・ストレージ形式をサポート:ParquetとVortex の 2 つのストレージ形式をサポートし、同時実行性とメモリ効率を向上。
自動ホット/コールドデータ分離とインテリジェントなスケジューリングによる階層化ストレージの実装。
Vector Lakeプロトタイプ(v0.1)
FFIを介してSpark/DuckDB/DataFusionと統合し、オフラインでのスキーマ進化とKNNクエリを実現。
マルチモーダルなデータ可視化とSpark ETLデモを提供し、データレイク・アーキテクチャの基礎を確立。
↪Milvus v3.0 (2026年初頭目標)
タイムライン2025年後半~2026年前半
フォーカスVector Lake (v0.2)のリリースに伴い、検索エクスペリエンス、スキーマの柔軟性、非構造化データのサポートを包括的に強化。
主なハイライト
🔹検索エクスペリエンスのオーバーホール
位置や否定例を含む検索をサポートするMore Like This(MLT)類似検索を導入。
ハイライトや ブーストなどのセマンティック検索機能を追加。
カスタム辞書と 類義語テーブルをサポートし、アナライザーレイヤーでの語彙的・意味的ルール定義を可能にします。
クエリーの集計機能を導入。
🔹マルチテナントとリソース管理
マルチテナントの削除、統計、ホット/コールド・ティアリングを可能にする。
リソースの分離とスケジューリング戦略を改善し、単一クラスタ内の数百万テーブルをサポート。
スキーマと主キーの強化
グローバル・プライマリ・キー重複排除(Global PK Dedup)を実装し、データの一貫性と一意性を保証。
柔軟なスキーマ管理(カラムの追加/削除、バックアップフィル)をサポート。
ベクトル・フィールドでNULL 値を許容。
🔹拡張された非構造化データ型 (BLOB / テキスト)
BLOB型の導入。ファイル、画像、動画などのバイナリ・データのネイティブ・ストレージと参照を提供。
TEXT タイプを導入し、フルテキストおよびコンテンツベースの検索機能を強化。
🔹エンタープライズグレードの機能
スナップショットベースのバックアップとリカバリをサポート
エンドツーエンドのトレースと 監査ロギングの提供
マルチクラスタ展開におけるアクティブスタンバイ高可用性(HA)の実装。
ベクターレイク(v0.2)
TEXT / BLOBストレージと 複数バージョンのスナップショット管理をサポート。
オフラインでのインデックス作成、クラスタリング、重複排除、次元削減タスクにSparkを統合。
ChatPDFコールドクエリとオフラインベンチマークデモを提供。
Milvus v3.1 (長期ビジョン)
スケジュール2026年半ば
フォーカスユーザー定義関数(UDF)、分散コンピューティングの統合、スカラークエリの最適化、ダイナミックシャーディング、Vector Lake(v1.0)の正式リリース。
主なハイライト
🔹UDFと分散コンピューティングのエコシステム
ユーザー定義関数(UDF)のサポートにより、開発者は検索や計算のワークフローにカスタムロジックを組み込むことができる。
Ray Dataset / Daftとの深い統合により、UDFの分散実行とマルチモーダルなデータ処理を実現。
スカラークエリーとローカルフォーマットの進化
スカラーフィールドのフィルタリングと集計のパフォーマンスを最適化。
式の評価とインデックスの高速実行を強化。
ローカルファイル形式のインプレース更新をサポート。
🔹高度な検索機能
以下の機能を追加:RankBy、OrderBy、Facet、Fuzzy matchクエリ。
テキスト検索の強化
match_phrase_prefixCompletion SuggesterTerm SuggesterPhrase Suggester
動的シャーディングとスケーラビリティ
自動シャード分割と ロードバランシングによるシームレスな拡張。
グローバルインデックスの構築を改善し、分散検索のパフォーマンスを確保します。
ベクターレイク V1.0
Ray / Daft / PyTorchと深く統合し、分散UDFとコンテキストエンジニアリングのユースケースをサポート。
RAG (Retrieval-Augmented Generation)の デモとIcebergテーブルからのインポートを提供。
🤝 Milvusの未来の共同構築
Milvusはグローバルな開発者コミュニティによって運営されているオープンソースプロジェクトです。
次世代のマルチモーダルデータベースを形成するために、コミュニティメンバーの皆様のご参加をお待ちしております:
💬フィードバックを共有する:新機能や最適化のアイデアを提案する
🐛問題を報告する:GitHub Issuesでバグを報告
🔧コードに貢献する:PRを提出し、コア機能の構築を手伝う
プルリクエスト:コードベースに直接貢献しましょう。バグの修正、機能の追加、ドキュメントの改善など、あなたの貢献を歓迎します。
開発ガイド:コード貢献に関するガイドラインは、コントリビューターガイドをご覧ください。
ベストプラクティスやサクセスストーリーを共有しましょう。
👉GitHub: milvus-io/milvus