🚀 Zilliz Cloudを無料で試す、完全管理型のMilvus—10倍の高速パフォーマンスを体験しよう!今すぐ試す>>

milvus-logo
LFAI
  • Home
  • Blog
  • Milvus2.4を発表:マルチベクトル探索、スパースベクトル、CAGRAインデックスなど!

Milvus2.4を発表:マルチベクトル探索、スパースベクトル、CAGRAインデックスなど!

  • Engineering
March 20, 2024
Fendy Feng

この度、大規模データセットの検索機能を強化したMilvus 2.4をリリースいたしました。この最新リリースでは、GPUベースのCAGRAインデックスのサポート、スパース埋込みのベータサポート、グループ検索、その他様々な検索機能の改善などの新機能が追加されています。これらの開発は、ベクトル・データの処理とクエリのための強力で効率的なツールを開発者に提供することで、コミュニティに対する我々のコミットメントを強化するものです。それでは、Milvus 2.4の主な利点をご紹介しましょう。

簡素化されたマルチモーダル検索のためのマルチベクトル検索が可能に

Milvus 2.4では、マルチベクトル検索機能が搭載され、同じMilvusシステム内で異なるベクトルタイプの同時検索と再ランク付けが可能になりました。この機能により、マルチモーダル検索が合理化され、想起率が大幅に向上し、開発者は様々なデータタイプを持つ複雑なAIアプリケーションを容易に管理できるようになります。さらに、この機能はカスタム再ランクモデルの統合と微調整を簡素化し、多次元データからの洞察を利用する正確な推奨システムのような高度な検索機能の作成を支援します。

How the Milti-Vector Search Feature Works ミルティベクトル検索機能の仕組み

Milvusにおけるマルチベクトルのサポートには2つの要素があります:

  1. コレクション内の1つのエンティティに対して複数のベクトルを保存/照会する機能。

  2. Milvusにあらかじめ組み込まれているリランキングアルゴリズムを活用し、リランキングアルゴリズムを構築/最適化する機能。

要望の多かった機能であることに加え、GPT-4とクロード3のリリースにより業界がマルチモーダルモデルに移行しつつあるため、この機能を構築しました。再ランク付けは、検索におけるクエリのパフォーマンスをさらに向上させるために一般的に使用されているテクニックです。開発者がMilvusエコシステム内で簡単にリランカーを構築し、最適化できるようにすることを目指しました。

グループ化検索のサポートによる計算効率の向上

グループ化検索は、Milvus 2.4で追加されたもう一つの要望の多かった機能です。BOOL型、INT型、VARCHAR型のフィールド用に設計されたグループ化操作を統合し、大規模なグループ化クエリを実行する際の重要な効率性のギャップを埋めています。

従来、開発者は、大規模なTop-K検索と、グループ固有の結果を抽出するための手作業による後処理に頼っていました。Grouping Searchは、クエリの結果を文書名やビデオ名などの集合的なグループ識別子に効率的にリンクすることで、このプロセスを改良し、大規模なデータセット内のセグメント化されたエンティティの取り扱いを効率化します。

Milvusは、イテレータベースの実装によりGrouping Searchを差別化し、類似のテクノロジーと比較して計算効率を著しく向上させています。この選択により、特に計算リソースの最適化が最優先される本番環境において、優れたパフォーマンスのスケーラビリティが保証されます。データトラバーサルと計算オーバーヘッドを削減することで、Milvusはより効率的なクエリ処理をサポートし、他のベクトルデータベースと比較してレスポンスタイムと運用コストを大幅に削減します。

グループ化検索は、大量の複雑なクエリを管理するMilvusの能力を強化し、堅牢なデータ管理ソリューションのためのハイパフォーマンス・コンピューティングの実践に合致します。

スパースベクトル埋め込みのベータサポート

スパース埋め込みは、従来の密なベクトルアプローチからのパラダイムシフトであり、単なるキーワード頻度ではなく、意味的類似性のニュアンスに対応します。この違いにより、クエリとドキュメントの意味的内容に密接に沿った、よりニュアンスのある検索機能が可能になります。情報検索や自然言語処理で特に有用なスパースベクトルモデルは、密なモデルと比較して、強力な領域外検索機能と解釈可能性を提供する。

Milvus 2.4では、SPLADEv2のような高度なニューラルモデルやBM25のような統計モデルによって生成されたスパース埋め込みを含むようにハイブリッド検索を拡張しました。Milvusでは、スパースベクトルは密なベクトルと同等に扱われ、スパースベクトルフィールドを持つコレクションの作成、データの挿入、インデックスの構築、類似検索の実行が可能です。特に、Milvusのスパース埋め込みは、内積(IP)距離メトリックをサポートしており、高次元の性質上、他のメトリックが有効でないことを考えると有利です。この機能は、次元が符号なし32ビット整数、値が32ビット浮動小数点であるデータ型もサポートしているため、微妙なテキスト検索から精巧な情報検索システムまで、幅広い応用が可能です。

この新機能により、Milvusはキーワードと埋め込みベースの技術を融合させたハイブリッド検索手法を可能にし、包括的でメンテナンスの少ないソリューションを求めるキーワード中心の検索フレームワークから移行するユーザーにシームレスな移行を提供します。

私たちは、この機能のパフォーマンステストを継続し、コミュニティからのフィードバックを収集するために、この機能を「ベータ」と表示しています。スパースベクトルサポートの一般提供(GA)は、Milvus 3.0のリリース時に予定されています。

高度なGPU加速グラフインデキシングのためのCAGRAインデックスサポート

NVIDIAによって開発されたCAGRA(Cuda Anns GRAph-based)は、GPUベースのグラフインデキシング技術であり、特に高スループット環境において、HNSWインデックスのような従来のCPUベースの手法を効率とパフォーマンスで大幅に凌駕します。

CAGRAインデックスの導入により、Milvus 2.4はGPUアクセラレーションによるグラフインデックス作成機能を強化しました。この機能強化は、最小限のレイテンシを必要とする類似検索アプリケーションの構築に最適です。さらに、Milvus 2.4はCAGRAインデックスとブルートフォース検索を統合することで、アプリケーションの最大再現率を実現します。詳細については、CAGRAの紹介ブログをご覧ください。

Milvus Raft CAGRA vs. Milvus HNSW Milvus Raft CAGRAとMilvus HNSWの比較

その他の機能強化

Milvus 2.4では、メタデータフィルタリングにおける部分文字列のマッチングを強化するための正規表現のサポート、スカラーデータタイプのフィルタリングを効率的に行うための新しいスカラー転置インデックス、Milvusコレクションの変更を監視し複製するための変更データキャプチャツールなど、その他の重要な機能強化も含まれています。これらのアップデートにより、Milvusのパフォーマンスと汎用性が強化され、複雑なデータ操作のための包括的なソリューションとなりました。

詳細はMilvus 2.4のドキュメントをご覧ください。

つながりを保つ

Milvus 2.4についてもっと知りたいですか?Zillizのエンジニアリング担当副社長であるJames Luanがこの最新リリースの機能について詳しく説明するウェビナーにご参加ください。ご質問やご意見がございましたら、当社のDiscordチャンネルに参加して、当社のエンジニアやコミュニティメンバーと交流してください。Milvusに関する最新ニュースやアップデートについては、Twitterや LinkedInでのフォローをお忘れなく。

Like the article? Spread the word

続けて読む