IVF_PQ
IVF_PQインデックスは、高次元空間における近似最近傍探索のための量子化ベースのインデックス作成アルゴリズムである。グラフベースの手法ほど高速ではないが、IVF_PQは多くの場合メモリ使用量を大幅に削減できるため、大規模なデータセットに対して実用的な選択肢となる。
概要
IVF_PQは Inverted File with Product Quantizationの略で、効率的なベクトル検索と検索のためにインデックス作成と圧縮を組み合わせたハイブリッドアプローチである。IVF_PQは2つのコアコンポーネントを活用しています:反転ファイル(IVF)と積量子化(PQ)です。
IVF
IVFは、本の索引を作るようなものです。すべてのページ(私たちの場合はすべてのベクトル)をスキャンする代わりに、インデックスで特定のキーワード(クラスタ)を検索し、関連するページ(ベクトル)をすばやく見つけます。このシナリオでは、ベクターはクラスターにグループ化され、アルゴリズムはクエリーベクターに近いいくつかのクラスター内を検索します。
以下がその仕組みだ:
クラスタリング:ベクトルデータセットは、k-meansのようなクラスタリングアルゴリズムを使用して、指定された数のクラスタに分割されます。各クラスタにはセントロイド(クラスタを代表するベクトル)があります。
割り当て:各ベクトルは、セントロイドが最も近いクラスタに割り当てられます。
転置インデックス:各クラスタのセントロイドを、そのクラスタに割り当てられたベクトルのリストにマッピングするインデックスが作成されます。
検索:最近傍を検索する場合、検索アルゴリズムはクエリベクトルとクラスタ重心を比較し、最も有望なクラスタを選択します。そして、その選択されたクラスタ内のベクトルに検索が絞り込まれます。
技術的な詳細については、IVF_FLAT を参照してください。
PQ
Product Quantization (PQ)は、高次元ベクトルの圧縮手法であり、高速な類似性検索を可能にすると同時に、ストレージ要件を大幅に削減します。
PQプロセスには以下の主要な段階があります:
Ivf Pq 1
次元分解:このアルゴリズムは、各高次元ベクトルを
m等しい大きさの部分ベクトルに分解することから始まる。この分解により、元のD次元空間はm分割された部分空間に変換され、各下部空間はD/m次元を含む。パラメータmは分解の粒度を制御し、圧縮率に直接影響する。部分空間コードブック生成:それぞれの部分空間内で、アルゴリズムはk-meansクラスタリングを適用し、代表ベクトル(セントロイド)の集合を学習する。これらのセントロイドは集合的に、その部分空間のコードブックを形成する。各コードブックにおけるセントロイドの数は、パラメータ
nbitsによって決定される。各コードブックには2nビットのセントロイドが含まれる。例えば、nbits = 8の場合、各コードブックは256個のセントロイドを含む。各セントロイドには、nbitsビットの一意なインデックスが割り当てられる。ベクトル 量子化:元のベクトル内の各サブベクトルについて、PQは対応する部分空間内で、特定のメトリックタイプを使用して、その最も近いセントロイドを特定する。このプロセスは、各サブベクトルをコードブック内の最も近い代表ベクトルに効果的にマッピングする。完全な部分ベクトル座標を格納する代わりに、マッチしたセントロイドのインデックスのみが保持される。
圧縮表現:最終的な圧縮表現は、各サブスペースから1つずつ、
m、PQコードと総称されるインデックスで構成される。このエンコーディングにより、D×32ビット(32ビット浮動小数点数を仮定)からm×nビットへとストレージ要件が削減され、ベクトル距離の近似能力を維持しながら大幅な圧縮が達成されます。
パラメータのチューニングと最適化の詳細については、Index paramsを参照してください。
32ビット浮動小数点数を使用したD = 128次元のベクトルを考えます。PQパラメータm = 64(部分ベクトル)、nbits = 8(従って、部分空間あたりk =28 = 256セントロイド)で、ストレージ要件を比較することができます:
オリジナル・ベクトル:128次元×32ビット=4,096ビット
PQ圧縮ベクトル:64個の部分ベクトル×8ビット=512ビット
これは必要な記憶容量が8倍削減されたことを意味する。
PQによる距離計算
クエリーベクターで類似検索を行う場合、PQは以下のステップで効率的な距離計算を可能にする:
クエリの前処理
クエリ・ベクトルは、元のPQ分解構造と一致するように、
mサブ・ベクトルに分解される。各クエリーサブベクターとそれに対応するコードブック(2nbitのセントロイドを含む)に対して、すべてのセントロイドへの距離を計算し、格納する。
これにより、
mルックアップテーブルが生成され、各テーブルには2nbitsの距離が格納される。
距離近似
PQコードで表現されたデータベースベクトルに対して、クエリベクトルとの近似距離は以下のように計算される:
mの各サブベクトルについて、対応するルックアップテーブルから、格納されているセントロイドインデックスを使用して、事前に計算された距離を取得する。これらの
m距離を合計して、特定のメトリックタイプ(ユークリッド距離など)に基づく近似距離を得る。
IVF PQ 2
IVF + PQ
IVF_PQインデックスは、IVFとPQ の長所を組み合わせて検索を高速化する。この処理は2つのステップで行われる:
IVFによる粗いフィルタリング:IVFはベクトル空間をクラスタに分割し、検索範囲を狭める。データセット全体を評価する代わりに、このアルゴリズムはクエリーベクトルに最も近いクラスターのみに焦点を当てる。
PQによるきめ細かな比較:選択されたクラスタ内で、PQは圧縮・量子化されたベクトル表現を用いて近似距離を高速に計算する。
IVF_PQインデックスの性能は、IVFとPQの両アルゴリズムを制御するパラメータによって大きく影響を受けます。与えられたデータセットとアプリケーションに最適な結果を得るためには、これらのパラメータを調整することが極めて重要です。これらのパラメータの詳細と調整方法については、Index paramsを参照してください。
インデックスの構築
Milvusでベクトル場にIVF_PQ インデックスを構築するには、add_index() メソッドを使用し、index_type 、metric_type 、インデックス用の追加パラメータを指定します。
from pymilvus import MilvusClient
# Prepare index building params
index_params = MilvusClient.prepare_index_params()
index_params.add_index(
field_name="your_vector_field_name", # Name of the vector field to be indexed
index_type="IVF_PQ", # Type of the index to create
index_name="vector_index", # Name of the index to create
metric_type="L2", # Metric type used to measure similarity
params={
"m": 4, # Number of sub-vectors to split eahc vector into
} # Index building params
)
この設定では
index_type:構築するインデックスのタイプ。この例ではIVF_PQとします。metric_type:ベクトル間の距離の計算方法。サポートされている値には、COSINE、L2、IPがあります。詳細については、メトリック・タイプを参照してください。params:インデックスを構築するための追加設定オプション。m:ベクトルを分割するサブベクトルの数。
IVF_PQインデックスで使用可能な構築パラメータの詳細については、インデックス構築パラメータを参照してください。
インデックス・パラメータを構成したら、create_index() メソッドを直接使用するか、create_collection メソッドでインデックス・パラメータを渡してインデックスを作成できます。詳細は、コレクションの作成 を参照してください。
インデックスでの検索
インデックスが構築され、エンティティが挿入されると、インデックス上で類似検索を実行できます。
search_params = {
"params": {
"nprobe": 10, # Number of clusters to search
}
}
res = MilvusClient.search(
collection_name="your_collection_name", # Collection name
anns_field="vector_field", # Vector field name
data=[[0.1, 0.2, 0.3, 0.4, 0.5]], # Query vector
limit=3, # TopK results to return
search_params=search_params
)
この構成では
params:インデックスで検索するための追加構成オプション。nprobe:検索するクラスタの数。
IVF_PQインデックスで利用可能な検索パラメータについては、インデックス固有の検索パラメータを参照してください。
インデックスパラメータ
このセクションでは、インデックスを構築し、インデックス上で検索を実行する際に使用するパラメータの概要を説明します。
インデックス構築パラメータ
以下の表は、params でインデックスを構築する際に設定できるパラメータの一覧です。
パラメータ |
説明 |
値の範囲 |
チューニングの提案 |
|
|---|---|---|---|---|
IVF |
|
インデックス構築時にk-meansアルゴリズムを使用して作成するクラスタの数。 |
型:整数:[1, 65536] デフォルト値: |
より大きな |
PQ |
|
量子化処理時に各高次元ベクトルを分割するサブベクトルの数(量子化に使用)。 |
タイプ:整数:[1, 65536] デフォルト値:なし |
ほとんどの場合、この範囲内の値を設定することをお勧めします:[D/8, D]。 |
|
各サブベクトルの重心インデックスを圧縮形式で表現するためのビット数。各コードブックのサイズを直接決定する。各コードブックは2nビットのセントロイドを含む。例えば、 |
タイプ整数:[1, 24] デフォルト値: |
|
インデックス固有の検索パラメータ
次の表は、インデックスを検索する際にsearch_params.params で設定できるパラメータの一覧です。
パラメータ |
説明 |
値の範囲 |
チューニングサジェスチョン |
|
|---|---|---|---|---|
IVF |
|
候補を検索するクラスタの数。 |
型:整数Range:[1,nlist] デフォルト値: |
値を大きくすると、より多くのクラスタを検索できるようになり、検索範囲を広げることでリコールを向上させますが、その代償としてクエリの待ち時間が増加します。速度と精度のバランスをとるために、 ほとんどの場合、この範囲内の値を設定することをお勧めします:[1, nlist]。 |