🚀 免費嘗試 Zilliz Cloud,完全托管的 Milvus,體驗速度提升 10 倍!立即嘗試

milvus-logo
LFAI
主頁
  • 管理指南

queryNode 相關組態

queryNode 的相關設定,用於執行向量與標量資料之間的混合搜尋。

queryNode.stats.publishInterval

說明 預設值
查詢節點公佈節點統計資訊的間隔,包括區段狀態、cpu 使用量、記憶體使用量、健康狀態等。單位:毫秒。 1000

queryNode.segcore.knowhereThreadPoolNumRatio

說明 預設值
knowhere線程池中的線程數。如果啟用磁碟,線程池數目會乘以knowhereThreadPoolNumRatio([1, 32])。 4

queryNode.segcore.chunkRows

說明 預設值
Segcore 將區段分割成小塊的行數。 128

queryNode.segcore.interimIndex.enableIndex

說明 預設值
  • 是否為成長中的區段和尚未建立索引的封存區段建立臨時索引,以改善搜尋效能。
  • Milvus 最終會封存所有區段並編製索引,但啟用此功能可優化資料插入後立即查詢的搜尋效能。
  • 預設為 true,表示 Milvus 會為成長中的區段和搜尋時尚未建立索引的封存區段建立暫存索引。
  • queryNode.segcore.interimIndex.nlist

    說明 預設值
    臨時索引 nlist,建議設定 sqrt(chunkRows),必須小於 chunkRows/8 128

    queryNode.segcore.interimIndex.nprobe

    說明 預設值
    nprobe 搜尋小索引,根據您的精確度要求,必須小於 nlist 16

    queryNode.segcore.interimIndex.memExpansionRate

    說明 預設值
    建立臨時索引所需的額外記憶體 1.15

    queryNode.segcore.interimIndex.buildParallelRate

    說明 預設值
    建立臨時索引與 CPU 數量並行匹配的比率 0.5

    queryNode.segcore.multipleChunkedEnable

    說明 預設值
    啟用多重分塊搜尋

    queryNode.segcore.knowhereScoreConsistency

    說明 預設值
    啟用 knowhere 強一致性分數計算邏輯

    queryNode.loadMemoryUsageFactor

    說明 預設值
    計算載入區段時記憶體使用量的乘數因子 1

    queryNode.enableDisk

    說明 預設值
    啟用 querynode 載入磁碟索引,並在磁碟索引上搜尋

    queryNode.cache.memoryLimit

    說明 預設值
    2 GB、2 * 1024 *1024 *1024 2147483648

    queryNode.cache.readAheadPolicy

    說明 預設值
    chunk cache 的讀取超前原則,選項:normal、random、sequential、willneed、dontneed 需要

    queryNode.cache.warmup

    說明 預設值
  • 選項:async、sync、disable。
  • 指定預熱 chunk 快取記憶體的必要性。
  • 1.如果設定為 "sync 「或 」async",原始向量資料會在載入過程中同步/非同步載入到
  • 在載入過程中,原始向量資料會同步/非同步載入到 chunk 快取記憶體中。此方法有可能大幅降低查詢/搜尋延遲。
  • 在載入後的特定時間內的查詢/搜尋延遲,但同時也會增加磁碟使用量;
  • 2.如果設定為「停用」,原始向量資料只會在搜尋/查詢期間載入到快取記憶體。
  • 停用

    queryNode.mmap.vectorField

    說明 預設值
    啟用 mmap 載入向量資料

    queryNode.mmap.vectorIndex

    說明 預設值
    啟用 mmap 載入向量索引

    queryNode.mmap.scalarField

    說明 預設值
    啟用 mmap 載入標量資料

    queryNode.mmap.scalarIndex

    說明 預設值
    啟用 mmap 以載入標量索引

    queryNode.mmap.chunkCache

    說明 預設值
    啟用 mmap 作為 chunk cache (原始向量擷取)。

    queryNode.mmap.growingMmapEnabled

    說明 預設值
  • 啟用記憶體映射 (mmap) 以最佳化處理成長中的原始資料。
  • 啟用此功能後,與新增或修改資料相關的記憶體開銷將大幅降低。
  • 不過,此最佳化的代價可能是略微降低受影響資料段的查詢延遲。
  • 錯誤

    queryNode.mmap.fixedFileSizeForMmapAlloc

    說明 預設值
    mmap chunk manager 的 tmp 檔大小 1

    queryNode.mmap.maxDiskUsagePercentageForMmapAlloc

    說明 預設值
    mmap chunk manager 使用的磁碟百分比 50

    queryNode.lazyload.enabled

    說明 預設值
    啟用 lazyload 載入資料

    queryNode.lazyload.waitTimeout

    說明 預設值
    開始執行 lazyload 搜尋與擷取之前的最大等待逾時長度 (以毫秒為單位) 30000

    queryNode.lazyload.requestResourceTimeout

    說明 預設值
    等待懶惰載入請求資源的最大超時時間(以毫秒為單位),預設為 5 秒 5000

    queryNode.lazyload.requestResourceRetryInterval

    說明 預設值
    等待延遲載入請求資源的重試間隔 (毫秒),預設為 2 秒 2000

    queryNode.lazyload.maxRetryTimes

    說明 預設值
    懶惰載入的最大重試次數,預設為 1 1

    queryNode.lazyload.maxEvictPerRetry

    說明 預設值
    偷懶載入的最大驅逐次數,預設為 1 1

    queryNode.indexOffsetCacheEnabled

    說明 預設值
    啟用某些標量索引的索引偏移快取,現在只針對位圖索引,啟用此參數可以改善從索引擷取原始資料的效能

    queryNode.scheduler.maxReadConcurrentRatio

    說明 預設值
  • maxReadConcurrentRatio 是讀取任務(搜尋任務和查詢任務)的並發比率。
  • 最大讀取並發率為 hardware.GetCPUNum * maxReadConcurrentRatio 的值。
  • 預設值為 2.0,這表示最大讀取並發率是 hardware.GetCPUNum * 2 的值。
  • 最大讀取並發度必須大於或等於 1,且小於或等於 hardware.GetCPUNum * 100。
  • (0, 100]
  • 1

    queryNode.scheduler.cpuRatio

    說明 預設值
    用來估計讀取任務 CPU 使用量的比率。 10

    queryNode.scheduler.scheduleReadPolicy.name

    說明 預設值
  • fifo:支援排程的 FIFO 佇列。
  • user-task-polling:使用者任務輪詢:
  • 使用者的任務會逐一輪詢並排程。
  • 排程對任務粒度是公平的。
  • 政策基於用戶名進行驗證。
  • 而空的使用者名稱會被視為同一使用者。
  • 當沒有多使用者時,政策會衰減為 FIFO"
  • 先進先出

    queryNode.scheduler.scheduleReadPolicy.taskQueueExpire

    說明 預設值
    控制佇列為空後會保留多久 (多少秒) 60

    queryNode.scheduler.scheduleReadPolicy.enableCrossUserGrouping

    說明 預設值
    使用 user-task-polling 策略時,啟用交叉使用者群組。(如果使用者的任務不能相互合併,請停用)

    queryNode.scheduler.scheduleReadPolicy.maxPendingTaskPerUser

    說明 預設值
    排程器中每個使用者的最大待處理工作 1024

    queryNode.levelZeroForwardPolicy

    說明 預設值
    委託者層級的零刪除前進政策,可能的選項["FilterByBF", "RemoteLoad"]] 。 篩選依據 BF

    queryNode.streamingDeltaForwardPolicy

    說明 預設值
    委託者串流刪除前向原則,可能的選項["FilterByBF", "Direct"] (直接刪除) 篩選條件

    queryNode.dataSync.flowGraph.maxQueueLength

    說明 預設值
    查詢節點流量圖中任務佇列快取的最大大小。 16

    queryNode.dataSync.flowGraph.maxParallelism

    說明 預設值
    流程圖中並行執行的最大任務數 1024

    queryNode.enableSegmentPrune

    說明 預設值
    在分區委託人的搜尋/查詢中,使用分區統計資料修剪資料

    queryNode.queryStreamBatchSize

    說明 預設值
    返回流查詢的最小批次大小 4194304

    queryNode.queryStreamMaxBatchSize

    說明 預設值
    回傳串流查詢的最大批次大小 134217728

    queryNode.bloomFilterApplyParallelFactor

    說明 預設值
    將 pk 應用於 bloom filter 時的平行因子,預設為 4*CPU_CORE_NUM 4

    queryNode.workerPooling.size

    說明 預設值
    Workerynode 用戶端池的大小 10

    queryNode.ip

    說明 預設值
    查詢節點的 TCP/IP 位址。若未指定,則使用第一個可單點傳送的位址。

    queryNode.port

    說明 預設值
    查詢節點的 TCP 埠 21123

    queryNode.grpc.serverMaxSendSize

    說明 預設值
    查詢節點可以傳送的每個 RPC 請求的最大大小,單位:位元組 536870912

    queryNode.grpc.serverMaxRecvSize

    說明 預設值
    查詢節點可接收的每個 RPC 請求的最大大小,單位:位元組 268435456

    queryNode.grpc.clientMaxSendSize

    說明 預設值
    查詢節點上的用戶端可以傳送的每個 RPC 請求的最大大小,單位:位元組 268435456

    queryNode.grpc.clientMaxRecvSize

    說明 預設值
    查詢節點用戶端可接收的每個 RPC 請求的最大大小,單位:位元組 536870912
    目錄

    免費嘗試托管的 Milvus

    Zilliz Cloud 無縫接入,由 Milvus 提供動力,速度提升 10 倍。

    開始使用
    反饋

    這個頁面有幫助嗎?