Milvus ロードマップ

🌌 次世代のマルチモーダルデータベースとデータレイクに向けて

Milvus製品ロードマップ

Milvusロードマップへようこそ!

構造化データから非構造化データまでリアルタイム検索からオフライン分析までシングルクラスタのパフォーマンスからグローバルデータレイクアーキテクチャまで、Milvusは次世代マルチモーダルデータベースという新たな時代に突入します。

このロードマップは、Milvus v2.6(進行中)Milvus v3.0(2026年後半を目標)Milvus v3.1(長期開発)の中核目標の概要と、Vector Lake(データレイク/Loon)の進化計画を示しています。

🧩 Milvus v2.6 (進行中)

タイムライン2025年半ば~2025年末

フォーカスデータモデルのアップグレードストリーミングアーキテクチャのリファクタリングホット/コールドティアリング機能の構築ベクターレイクプロトタイプ(v0.1)のローンチ。

主なハイライト

データモデルのアップグレード

  • マルチベクトル埋め込み構造をサポートする統一されたTensor / StructListデータ型を導入し、ColBERTCoLQwenビデオマルチモーダルベクトルとの互換性を実現。

  • ポイント、リージョン、空間インデックス(libspatialベース)を含むGeo Dataサポートを追加し、LBSやGISでのユースケースを拡大。

  • Timestamp with Timezoneデータ型のサポート。

🔹 StreamNode アーキテクチャのリファクタリング

  • ストリーミング・インジェスト・パイプラインを書き換えて、増分書き込みとリアルタイム計算を最適化。

  • 同時実行のパフォーマンスと安定性を大幅に改善し、リアルタイムとオフラインの統合処理の基礎を築く。

  • 新しいメッセージキュー・エンジンを導入:ウッドペッカー

ホット/コールド・ティアリングとストレージ・アーキテクチャ (StorageV2)

  • デュアル・ストレージ形式をサポート:ParquetVortex の 2 つのストレージ形式をサポートし、同時実行性とメモリ効率を向上。

  • 自動ホット/コールドデータ分離とインテリジェントなスケジューリングによる階層化ストレージの実装。

Vector Lakeプロトタイプ(v0.1)

  • FFIを介してSpark/DuckDB/DataFusionと統合し、オフラインでのスキーマ進化とKNNクエリを実現。

  • マルチモーダルなデータ可視化とSpark ETLデモを提供し、データレイク・アーキテクチャの基礎を確立。

↪Milvus v3.0 (2026年初頭目標)

タイムライン2025年後半~2026年前半

フォーカスVector Lake (v0.2)のリリースに伴い、検索エクスペリエンススキーマの柔軟性非構造化データのサポートを包括的に強化。

主なハイライト

🔹検索エクスペリエンスのオーバーホール

  • 位置や否定例を含む検索をサポートするMore Like This(MLT)類似検索を導入。

  • ハイライトや ブーストなどのセマンティック検索機能を追加。

  • カスタム辞書と 類義語テーブルをサポートし、アナライザーレイヤーでの語彙的・意味的ルール定義を可能にします。

  • クエリーの集計機能を導入。

🔹マルチテナントとリソース管理

  • マルチテナントの削除、統計、ホット/コールド・ティアリングを可能にする。

  • リソースの分離とスケジューリング戦略を改善し、単一クラスタ内の数百万テーブルをサポート。

スキーマと主キーの強化

  • グローバル・プライマリ・キー重複排除(Global PK Dedup)を実装し、データの一貫性と一意性を保証。

  • 柔軟なスキーマ管理(カラムの追加/削除、バックアップフィル)をサポート。

  • ベクトル・フィールドでNULL 値を許容。

🔹拡張された非構造化データ型 (BLOB / テキスト)

  • BLOB型の導入。ファイル、画像、動画などのバイナリ・データのネイティブ・ストレージと参照を提供。

  • TEXT タイプを導入し、フルテキストおよびコンテンツベースの検索機能を強化。

🔹エンタープライズグレードの機能

  • スナップショットベースのバックアップとリカバリをサポート

  • エンドツーエンドのトレースと 監査ロギングの提供

  • マルチクラスタ展開におけるアクティブスタンバイ高可用性(HA)の実装。

ベクターレイク(v0.2)

  • TEXT / BLOBストレージと 複数バージョンのスナップショット管理をサポート。

  • オフラインでのインデックス作成、クラスタリング、重複排除、次元削減タスクにSparkを統合。

  • ChatPDFコールドクエリとオフラインベンチマークデモを提供。

Milvus v3.1 (長期ビジョン)

スケジュール2026年半ば

フォーカスユーザー定義関数(UDF)分散コンピューティングの統合スカラークエリの最適化ダイナミックシャーディングVector Lake(v1.0)の正式リリース。

主なハイライト

🔹UDFと分散コンピューティングのエコシステム

  • ユーザー定義関数(UDF)のサポートにより、開発者は検索や計算のワークフローにカスタムロジックを組み込むことができる。

  • Ray Dataset / Daftとの深い統合により、UDFの分散実行とマルチモーダルなデータ処理を実現。

スカラークエリーとローカルフォーマットの進化

  • スカラーフィールドのフィルタリングと集計のパフォーマンスを最適化。

  • 式の評価とインデックスの高速実行を強化。

  • ローカルファイル形式のインプレース更新をサポート。

🔹高度な検索機能

  • 以下の機能を追加:RankByOrderByFacetFuzzy matchクエリ。

  • テキスト検索の強化

    • match_phrase_prefix

    • Completion Suggester

    • Term Suggester

    • Phrase Suggester

動的シャーディングとスケーラビリティ

  • 自動シャード分割と ロードバランシングによるシームレスな拡張。

  • グローバルインデックスの構築を改善し、分散検索のパフォーマンスを確保します。

ベクターレイク V1.0

  • Ray / Daft / PyTorchと深く統合し、分散UDFとコンテキストエンジニアリングのユースケースをサポート。

  • RAG (Retrieval-Augmented Generation)の デモとIcebergテーブルからのインポートを提供。

🤝 Milvusの未来の共同構築

Milvusはグローバルな開発者コミュニティによって運営されているオープンソースプロジェクトです。

次世代のマルチモーダルデータベースを形成するために、コミュニティメンバーの皆様のご参加をお待ちしております:

  • 💬フィードバックを共有する:新機能や最適化のアイデアを提案する

  • 🐛問題を報告する:GitHub Issuesでバグを報告

  • 🔧コードに貢献する:PRを提出し、コア機能の構築を手伝う

    • プルリクエストコードベースに直接貢献しましょう。バグの修正、機能の追加、ドキュメントの改善など、あなたの貢献を歓迎します。

    • 開発ガイド:コード貢献に関するガイドラインは、コントリビューターガイドをご覧ください。

  • ベストプラクティスやサクセスストーリーを共有しましょう

👉GitHub: milvus-io/milvus