製品に関するFAQ
Milvusの価格はいくらですか?
Milvusは100%無償のオープンソースプロジェクトです。
Milvusを生産または配布目的で使用する場合は、Apache License 2.0を遵守してください。
Milvusの開発元であるZilliz社では、分散インスタンスの構築や保守が不要な方向けに、完全マネージド型のクラウドプラットフォームも提供しています。Zilliz Cloudは自動的にデータの信頼性を維持し、ユーザーは使用した分だけ支払うことができる。
Milvusはx86以外のアーキテクチャに対応していますか?
Milvusはx86以外のプラットフォームにはインストールも実行もできません。
Milvusを実行するにはCPUがSSE4.2、AVX、AVX2、AVX512のいずれかの命令セットをサポートしている必要があります。これらはすべてx86専用のSIMD命令セットです。
Milvusで扱えるデータセットの最大サイズは?
理論上、Milvusが扱えるデータセットの最大サイズは実行するハードウェア、特にシステムメモリとストレージによって決まります:
- Milvusはクエリを実行する前に、指定された全てのコレクションとパーティションをメモリにロードします。したがって、メモリサイズがMilvusがクエリできる最大データ量を決定します。
- Milvusに新しいエンティティやコレクション関連のスキーマ(現在のところデータ永続化のためにMinIOのみがサポートされています)が追加された場合、システムストレージが挿入可能なデータの最大サイズを決定します。
Milvusはどこにデータを保存するのか?
Milvusは挿入データとメタデータの2種類のデータを扱います。
ベクターデータ、スカラーデータ、コレクション固有のスキーマを含む挿入データは、インクリメンタルログとして永続ストレージに保存されます。Milvusは、MinIO、AWS S3、Google Cloud Storage(GCS)、Azure Blob Storage、Alibaba Cloud OSS、Tencent Cloud Object Storage(COS)など、複数のオブジェクトストレージバックエンドをサポートしています。
メタデータはMilvus内で生成されます。各Milvusモジュールは、etcdに格納される独自のメタデータを持っています。
なぜetcdにはベクターデータがないのか?
etcdにはMilvusモジュールのメタデータが格納され、MinIOにはエンティティが格納されます。
Milvusはデータの挿入と検索を同時にサポートしていますか?
挿入操作と検索操作は、互いに独立した2つのモジュールによって処理されます。クライアントから見ると、挿入されたデータがメッセージキューに入った時点で挿入操作は完了します。しかし、挿入されたデータはクエリ・ノードにロードされるまで検索できません。セグメントサイズがインデックス構築のしきい値(デフォルトでは512MB)に達しない場合、Milvusはブルートフォース検索に頼り、クエリのパフォーマンスが低下する可能性があります。
主キーが重複しているベクターをMilvusに挿入できますか?
はい。Milvusはベクターの主キーが重複しているかどうかをチェックしません。
主キーが重複しているベクターが挿入された場合、Milvusはそれを更新操作として扱いますか?
いいえ。現在、Milvusは更新操作に対応しておらず、エンティティのプライマリキーが重複しているかどうかのチェックも行っていません。エンティティの主キーが一意であることを確認するのはお客様の責任であり、そうでない場合、Milvusには主キーが重複する複数のエンティティが含まれる可能性があります。
このような場合、クエリ時にどのデータコピーが返されるかは未知のままです。この制限は将来のリリースで修正される予定です。
自分で定義したエンティティの主キーの最大長は?
エンティティ主キーは非負の64ビット整数でなければなりません。
1回の挿入操作で追加できるデータ量の上限は?
挿入操作のサイズは1,024 MBを超えてはなりません。これはgRPCによる制限です。
特定のパーティションで検索する場合、コレクション・サイズはクエリ・パフォーマンスに影響しますか?
いいえ。検索用のパーティションが指定されている場合、Milvusは指定されたパーティションのみを検索します。
検索にパーティションを指定した場合、Milvusはコレクション全体を読み込みますか?
いいえ。Milvusには様々な動作があります。検索前にデータをメモリにロードする必要があります。
- データがどのパーティションにあるかわかっている場合、
load_partition()
を呼び出して目的のパーティションをロードし、search()
メソッド呼び出しでパーティションを指定します。 - 正確なパーティションがわからない場合は、
search()
を呼び出す前にload_collection()
を呼び出します。 - 検索前にコレクションやパーティションのロードに失敗した場合、Milvusはエラーを返します。
ベクター挿入後にインデックスを作成することはできますか?
以前、create_index()
によってコレクションにインデックスが作成されていた場合、Milvusはその後に挿入されたベクターに自動的にインデックスを作成します。ただし、新しく挿入されたベクターがセグメント全体を満たし、新しく作成されたインデックスファイルが以前のものから分離されるまで、Milvusはインデックスを作成しません。
FLATインデックスとIVF_FLATインデックスの違いは何ですか?
IVF_FLATインデックスはベクター空間をリスト・クラスターに分割します。デフォルトのリスト値16,384の場合、Milvusはターゲットベクトルと16,384クラスタすべてのセントロイド間の距離を比較し、最も近いクラスタを返します。次にMilvusは、ターゲットベクトルと選択されたクラスタ内のベクトルとの距離を比較し、最近接ベクトルを取得します。IVF_FLATとは異なり、FLATはターゲットベクトルと他のすべてのベクトルとの距離を直接比較します。
ベクトルの総数がnlistにほぼ等しい場合、IVF_FLATとFLATの間には計算要件と探索性能の点でほとんど差がありません。しかし、ベクトル数が nlist の 2 倍以上になると、IVF_FLAT の方が性能面で有利になります。
詳細はベクターインデックスを参照してください。
Milvusはどのようにデータをフラッシュするのですか?
挿入されたデータがメッセージキューにロードされると、Milvusは成功を返します。しかし、データはまだディスクにフラッシュされていません。その後、Milvusのデータノードがメッセージキュー内のデータをインクリメンタルログとして永続ストレージに書き込みます。flush()
が呼び出された場合、データノードはメッセージキュー内の全データを直ちに永続ストレージに書き込むよう強制されます。
正規化とは何ですか?なぜ正規化が必要なのですか?
正規化とは、ノルムが1になるようにベクトルを変換する処理のことです。ベクトルの類似度を計算するために内積を使用する場合、ベクトルは正規化されなければなりません。正規化後、内積は余弦類似度に等しくなります。
詳しくはウィキペディアを参照。
なぜユークリッド距離 (L2) と内積 (IP) は異なる結果を返すのですか?
正規化されたベクトルでは、ユークリッド距離 (L2) は内積 (IP) と数学的に等価です。これらの類似度メトリクスが異なる結果を返す場合、ベクトルが正規化されているかどうかを確認してください。
Milvusのコレクションとパーティションの総数に制限はありますか?
Milvusインスタンスでは最大65,535コレクションまで作成できます。既存のコレクション数を計算する際、Milvusはシャードとパーティションを含むすべてのコレクションをカウントします。
例えば、既に100のコレクションを作成し、そのうち60に2シャードと4パーティション、残りの40に1シャードと12パーティションを作成したとします。現在のコレクション数は次のように計算できます:
60 * 2 * 4 + 40 * 1 * 12 = 960
topk
ベクトルを検索すると、なぜk個以下のベクトルしか得られないのですか?
Milvusがサポートするインデックスのうち、IVF_FLATとIVF_SQ8はk-meansクラスタリング法を実装しています。データ空間はnlist
クラスタに分割され、挿入されたベクトルはこれらのクラスタに分配されます。そしてMilvusはnprobe
最も近いクラスタを選択し、ターゲットベクトルと選択されたクラスタ内のすべてのベクトルとの距離を比較して最終結果を返します。
nlist
とtopk
が大きく、nprobe が小さい場合、nprobe クラスタ内のベクトル数がk
より少なくなることがあります。そのため、topk
に最も近いベクトルを検索すると、返されるベクトル数がk
より少なくなります。
これを避けるには、nprobe
を大きく、nlist
とk
を小さく設定してみてください。
詳しくはベクトル・インデックスをご覧ください。
Milvusでサポートされる最大ベクトル次元は?
Milvusはデフォルトで最大32,768次元のベクトルを管理できます。Proxy.maxDimension
の値を大きくすることで、より大きな次元のベクトルを扱うことができます。
MilvusはApple M1 CPUをサポートしていますか?
現在のMilvusはApple M1 CPUをサポートしておりません。
Milvusは主キーフィールドでどのようなデータタイプをサポートしていますか?
現在のリリースでは、INT64と文字列の両方をサポートしています。
Milvusはスケーラブルですか?
はい、Kubernetes上のHelm Chart経由で複数ノードのMilvusクラスタをデプロイすることができます。詳しくはスケールガイドをご参照ください。
クエリはメモリ上で実行されますか?増分データ、履歴データとは何ですか?
はい。Milvusはクエリリクエストが来ると、インクリメンタルデータとヒストリカルデータの両方をメモリにロードして検索します。インクリメンタルデータは、ストレージエンジンに永続化される閾値に達する前にメモリにバッファリングされる成長セグメントのデータであり、履歴データはオブジェクトストレージに保存される封印されたセグメントのデータです。インクリメンタルデータとヒストリカルデータを合わせて、検索対象のデータセット全体を構成します。
Milvusは同時検索に対応していますか?
はい。同じコレクションに対するクエリの場合、Milvusはインクリメンタルデータと履歴データを同時に検索します。ただし、異なるコレクションに対するクエリは直列に行われます。履歴データは非常に巨大なデータセットになる可能性がありますが、履歴データに対する検索は比較的時間がかかり、基本的に直列に実行されます。
対応するコレクションが削除された後も、MinIOのデータが残るのはなぜですか?
MinIOのデータは、データのロールバックの便宜のため、一定期間残るように設計されています。
MilvusはPulsar以外のメッセージ・エンジンをサポートしていますか?
はい。KafkaはMilvus 2.1.0でサポートされています。
検索とクエリの違いは何ですか?
Milvusでは、ベクトル類似度検索は類似度計算とベクトル・インデックス加速に基づいてベクトルを検索します。ベクトル類似性検索とは異なり、ベクトル検索はブーリアン式に基づくスカラーフィルタリングによってベクトルを検索します。ブーリアン式はスカラーフィールドまたは主キーフィールドをフィルタリングし、フィルタに一致するすべての結果を取得します。クエリでは、類似度メトリクスもベクトル・インデックスも関与しません。
なぜMilvusではfloatベクトル値の精度が小数点以下7桁なのですか?
MilvusはベクトルをFloat32配列として格納することをサポートしています。Float32の値の精度は小数点以下7桁です。1.3476964684980388のようなFloat64の値であっても、Milvusは1.347696として格納します。したがって、このようなベクトルをMilvusから取り出すと、Float64の値の精度は失われます。
Milvusはベクタのデータ型と精度をどのように扱うのですか?
MilvusはBinary、Float32、Float16、BFloat16のベクトル型をサポートしています。
- バイナリベクタ:0と1のシーケンスとしてバイナリデータを格納し、画像処理や情報検索に使用されます。
- Float32ベクトル:10進数約7桁の精度で格納される。Float64の値もFloat32の精度で格納されるため、検索時に精度が低下する可能性がある。
- Float16 および BFloat16 ベクタ:精度とメモリ使用量が削減されます。Float16は帯域幅とストレージが限られたアプリケーションに適しており、BFloat16は範囲と効率のバランスが取れており、精度に大きな影響を与えることなく計算量を減らすためにディープラーニングでよく使用されます。
Milvusはスカラーフィールドやベクトルフィールドのデフォルト値の指定に対応していますか?
現在のところ、Milvus 2.4.xではスカラーフィールドやベクトルフィールドのデフォルト値の指定はサポートしていません。この機能は将来のリリースを予定しています。
まだ質問がありますか?
できます:
- GitHubでMilvusをチェックしてください。質問をしたり、アイデアを共有したり、他の人を助けたりすることができます。
- Slackのコミュニティに参加して、オープンソースコミュニティに参加してください。