HNSW_PRQ

HNSW_PRQ利用分层可导航小世界(HNSW)图与残差产品量化(PRQ),提供了一种先进的向量索引方法,使您可以在索引大小和准确性之间进行微调。PRQ 超越了传统的乘积量化 (PQ),引入了残差量化 (RQ) 步骤来捕捉更多信息,与纯粹基于 PQ 的方法相比,PRQ 可实现更高的精度或更紧凑的索引。不过,额外的步骤会导致索引构建和搜索过程中的计算开销增加。

概述

HNSW_PRQ 结合了两种索引技术:HSNW用于基于图的快速导航,PRQ用于高效的向量压缩。

HNSW

HNSW 构建了一个多层图,其中每个节点都对应数据集中的一个向量。在该图中,节点根据其相似性进行连接,从而实现在数据空间中的快速遍历。分层结构允许搜索算法缩小候选邻域的范围,从而大大加快了高维空间的搜索过程。

更多信息,请参阅HNSW

PRQ

PRQ 是一种多阶段向量压缩方法,结合了两种互补技术:PQ 和 RQ。PRQ 首先将高维向量分割成较小的子向量(通过 PQ),然后对剩余的差值进行量化(通过 RQ),从而实现对原始数据紧凑而精确的表示。

下图显示了其工作原理。

Hnsw Prq Hnsw Prq

  1. 乘积量化 (PQ)

    在这一阶段,原始向量被划分为更小的子向量,每个子向量都被映射到学习的编码本中与其最近的中心点。这种映射大大减少了数据量,但会带来一些舍入误差,因为每个子向量都是由一个中心点近似而成的。更多详情,请参阅IVF_PQ

  2. 残差量化(RQ)

    在 PQ 阶段之后,RQ 使用额外的编码本量化残差--原始向量与其基于 PQ 的近似值之间的差值。由于残差通常要小得多,因此可以在不增加大量存储空间的情况下对其进行更精确的编码。

    参数nrq 决定了残差被迭代量化的次数,让你可以微调压缩效率和精确度之间的平衡。

  3. 最终压缩表示

    RQ 完成对残差的量化后,PQ 和 RQ 的整数代码将合并为一个压缩索引。通过捕捉 PQ 可能忽略的精细细节,RQ 在不显著增加存储空间的情况下提高了精确度。PQ 和 RQ 之间的协同作用正是 PRQ 的定义。

HNSW + PRQ

通过将 HNSW 与 PRQ 相结合,HNSW_PRQ保留了 HNSW 基于图形的快速搜索,同时利用了 PRQ 的多级压缩优势。工作流程如下

  1. 数据压缩:每个向量首先通过 PQ 转换为粗略表示,然后通过 RQ 对残差进行量化以进一步细化。最后得到一组表示每个向量的紧凑代码。

  2. 图形构建:压缩向量(包括 PQ 和 RQ 编码)是构建 HNSW 图表的基础。由于数据是以压缩的形式存储的,因此图所需内存更少,导航速度也更快。

  3. 候选检索:在搜索过程中,HNSW 使用压缩表示法遍历图并检索候选库。这大大减少了需要考虑的向量数量。

  4. (可选)结果完善:可根据以下参数对初始候选结果进行改进,以提高准确性:

    • refine:控制是否激活该细化步骤。当设置为true 时,系统会使用更高精度或非压缩表示法重新计算距离。

    • refine_type:指定细化过程中使用的数据精度级别(如 SQ6、SQ8、BF16)。选择更高精度的数据,如FP32 ,可以得到更精确的结果,但需要更多内存。这必须比原始压缩数据集的精度高sq_type

    • refine_k:放大系数。例如,如果您的前k值是 100,而refine_k 是 2,系统就会对前 200 个候选项重新排序,并返回最好的 100 个,从而提高整体准确性。

有关参数和有效值的完整列表,请参阅索引参数

建立索引

要在 Milvus 中的向量场上建立HNSW_PRQ 索引,请使用add_index() 方法,为索引指定index_type,metric_type, 以及附加参数。

from pymilvus import MilvusClient

# Prepare index building params
index_params = MilvusClient.prepare_index_params()

index_params.add_index(
    field_name="your_vector_field_name", # Name of the vector field to be indexed
    index_type="HNSW_PRQ", # Type of the index to create
    index_name="vector_index", # Name of the index to create
    metric_type="L2", # Metric type used to measure similarity
    params={
        "M": 30, # Maximum number of neighbors each node can connect to in the graph
        "efConstruction": 360, # Number of candidate neighbors considered for connection during index construction
        "m": 384, 
        "nbits": 8,
        "nrq": 1,
        "refine": true, # Whether to enable the refinement step
        "refine_type": "SQ8" # Precision level of data used for refinement
    } # Index building params
)

在此配置中

  • index_type:要建立的索引类型。在本例中,将值设为HNSW_PQ

  • metric_type:用于计算向量间距离的方法。支持的值包括COSINE,L2, 和IP 。有关详情,请参阅公制类型

  • params:用于构建索引的附加配置选项。详情请参阅索引构建参数

配置好索引参数后,可直接使用create_index() 方法或在create_collection 方法中传递索引参数来创建索引。详情请参阅创建 Collections

在索引上搜索

建立索引并插入实体后,就可以在索引上执行相似性搜索。

search_params = {
    "params": {
        "ef": 10, # Parameter controlling query time/accuracy trade-off
        "refine_k": 1 # The magnification factor
    }
}

res = MilvusClient.search(
    collection_name="your_collection_name", # Collection name
    anns_field="vector_field",  # Vector field name
    data=[[0.1, 0.2, 0.3, 0.4, 0.5]],  # Query vector
    limit=3,  # TopK results to return
    search_params=search_params
)

在此配置中

索引参数

本节概述了用于建立索引和在索引上执行搜索的参数。

索引建立参数

下表列出了建立索引时可在params 中配置的参数。

参数

说明

值范围

调整建议

HNSW

M

图中每个节点可拥有的最大连接数(或边),包括出站边和入站边。 该参数直接影响索引构建和搜索。

类型: 整数整数范围:[2, 2048]

默认值30 (每个节点最多有 30 条出边和 30 条入边)

较大的M 通常会提高准确率,但会增加内存开销,并减慢索引构建和搜索速度。对于高维度数据集或高召回率至关重要时,可考虑增加M

当内存使用和搜索速度是首要考虑因素时,可考虑降低M

在大多数情况下,我们建议您在此范围内设置一个值:[5, 100].

efConstruction

索引构建过程中考虑连接的候选邻居数量。 每个新元素都会评估更多的候选邻居,但实际建立的最大连接数仍受M 限制。

类型: 整数整数范围:[1,int_max]

默认值360

efConstruction 越高,索引准确,因为会探索更多潜在连接。考虑增加efConstruction 以提高准确性尤其是在索引时间不太重要的情况下。

在资源紧张的情况下,可考虑降低efConstruction ,以加快索引构建速度。

在大多数情况下,我们建议在此范围内设置一个值:[50, 500].

PRQ

m

在量化过程中将每个高维向量分成的子向量数(用于量化)。

类型: 整数整数范围: [1, 65536[1, 65536]

默认值:无无

m m 必须是向量维数(D) 的除数,以确保正确分解。通常推荐的值是m = D/2

在大多数情况下,我们建议在此范围内设置一个值:[D/8,D]。

nbits

用于以压缩形式表示每个子向量中心点索引的比特数。每个编码本将包含2个比特的中心点。例如,如果nbits 设置为 8,则每个子向量将由一个 8 位的中心点索引表示。这样,该子向量的编码本中就有28(256)个可能的中心点。

类型: 整数整数[1, 24]

默认值8

nbits 值越大,编码本越大,可能会更精确地表示原始向量。在大多数情况下,我们建议在此范围内设置一个值:[1, 16].

nrq

控制在 RQ 阶段使用多少个剩余子量化器。更多的子量化器有可能实现更高的压缩率,但也可能带来更多的信息损失。

类型: 整数整数[1, 16]

默认值2

nrq 值越大,允许的剩余子量化步骤就越多,有可能带来更精确的原始向量重建。不过,这也意味着需要存储和计算更多的子量化器,从而导致索引大小增大和计算开销增大。

refine

布尔标志,用于控制是否在搜索过程中应用细化步骤。细化包括通过计算查询向量与候选向量之间的精确距离,对初始结果进行重新排序。

类型:布尔布尔范围:[true,false]

默认值false

如果需要高精确度,并且可以忍受稍慢的搜索时间,则设置为true 。如果速度是首要考虑因素,并且可以接受在精确度上略有妥协,则使用false

refine_type

确定细化过程中使用的数据精度。 该精度必须高于压缩向量的精度(由mnbits 参数设置)。

类型: 字符串字符串范围:[SQ6,SQ8,BF16,FP16,FP32 ]

默认值:无

FP32 SQ6SQ8 BF16 和 提供了一个平衡的替代方案。FP16

特定于索引的搜索参数

下表列出了在索引上搜索时可在search_params.params 中配置的参数。

参数

说明

值范围

调整建议

HNSW

ef

控制近邻检索时的搜索范围。它决定访问多少节点并将其评估为潜在近邻。 该参数只影响搜索过程,并且只适用于图形的底层。

类型: 整数整数范围:[1,int_max]

默认值limit(返回的前 K 个近邻)

ef 越大,通常搜索精度越高,因为会考虑更多的潜在近邻。当实现高召回率至关重要,而搜索速度则不那么重要时,可考虑增加ef

考虑降低ef 以优先提高搜索速度,尤其是在可以接受稍微降低准确率的情况下。

在大多数情况下,我们建议您在此范围内设置一个值:[K,10K]。

PRQ

refine_k

放大系数,用于控制相对于请求的前 K 个结果,在细化(重新排序)阶段检查多少额外的候选结果。

类型: 浮动浮动范围:[1,float_max)

默认值:1

refine_k 的值越大,召回率和准确率越高,但也会增加搜索时间和资源占用。值为 1 意味着细化过程只考虑最初的前 K 个结果。

想要更快、更简单、更好用的 Milvus SaaS服务 ?

Zilliz Cloud是基于Milvus的全托管向量数据库,拥有更高性能,更易扩展,以及卓越性价比

免费试用 Zilliz Cloud
反馈

此页对您是否有帮助?