milvus-logo
LFAI
フロントページへ
  • 管理ガイド

queryNode関連設定

ベクトルデータとスカラーデータのハイブリッド検索を実行するために使用されるqueryNodeの関連コンフィギュレーション。

queryNode.stats.publishInterval

説明 デフォルト値
クエリ・ノードがセグメント・ステータス、CPU使用率、メモリ使用率、ヘルス・ステータスなどのノード統計情報を公開する間隔。単位:ms 1000

queryNode.segcore.knowhereThreadPoolNumRatio

説明 デフォルト値
knowhere のスレッド・プールのスレッド数。ディスクが有効な場合、プール・サイズは knowhereThreadPoolNumRatio([1, 32])と乗算されます。 4

queryNode.segcore.chunkRows

説明 デフォルト値
Segcoreがセグメントをチャンクに分割する行数。 128

queryNode.segcore.interimIndex.enableIndex

説明 デフォルト値
  • 成長しているセグメントやまだインデックスが作成されていないセグメントに対して一時的なインデックスを作成し、検索性能を向上させるかどうか。
  • Milvusは最終的にすべてのセグメントを封印し、インデックスを作成しますが、これを有効にすると、データ挿入直後のクエリの検索パフォーマンスが最適化されます。
  • デフォルトは true で、Milvus は成長しているセグメントとまだインデックスが作成されていないセグメントに対して一時インデックスを作成します。
  • true

    queryNode.segcore.interimIndex.nlist

    説明 デフォルト値
    一時インデックスnlist、sqrt(chunkRows)を設定することを推奨。 128

    queryNode.segcore.interimIndex.nprobe

    説明 デフォルト値
    小さなインデックスを検索するためのnprobe。 16

    queryNode.segcore.interimIndex.memExpansionRate

    説明 デフォルト値
    中間インデックスの構築に必要な余分なメモリ 1.15

    queryNode.segcore.interimIndex.buildParallelRate

    説明 デフォルト値
    中間インデックスの並列構築とCPU数の比率 0.5

    queryNode.segcore.knowhereScoreConsistency

    説明 デフォルト値
    Knowhere 強一貫性スコア計算ロジックを有効にする

    queryNode.loadMemoryUsageFactor

    説明 デフォルト値
    セグメントをロードする際のメモリ使用量を計算する倍率 1

    queryNode.enableDisk

    説明 デフォルト値
    querynodeがディスクインデックスをロードし、ディスクインデックスを検索することを有効にする。 false

    queryNode.cache.memoryLimit

    説明 デフォルト値
    2 GB、2 * 1024 * 1024 * 1024 2147483648

    queryNode.cache.readAheadPolicy

    説明 デフォルト値
    チャンクキャッシュの先読みポリシー:normal、random、sequential、willneed、dontneed`。 ウィルニード

    queryNode.cache.warmup

    説明 デフォルト値
  • オプション: async、sync、disable。
  • チャンクキャッシュのウォームアップの必要性を指定する。
  • 1.sync "または "async "に設定された場合、オリジナルのベクトル・データはロード処理中に同期/非同期でチャンク・キャッシュにロードされる。
  • チャンクキャッシュに同期/非同期でロードされる。このアプローチは、ロード後の特定の期間、クエリ/検索の待ち時間を大幅に短縮する可能性がある。
  • を大幅に短縮する可能性がある。ただし、同時にディスク使用量が増加する;
  • 2.disable "に設定すると、オリジナルのベクターデータは検索/クエリ中にのみチャンクキャッシュにロードされます。
  • 無効

    queryNode.mmap.mmapEnabled

    説明 デフォルト値
    データをロードするためにmmapを有効にする false

    queryNode.mmap.growingMmapEnabled

    説明 デフォルト値
    生データを成長させるためにmmapを使用可能にする false

    queryNode.mmap.fixedFileSizeForMmapAlloc

    説明 デフォルト値
    mmapチャンクマネージャのtmpファイルサイズ 1

    queryNode.mmap.maxDiskUsagePercentageForMmapAlloc

    説明 デフォルト値
    mmap チャンクマネージャーで使用されるディスクのパーセンテージ 50

    queryNode.lazyload.enabled

    説明 デフォルト値
    データのロードに遅延ロードを有効にする false

    queryNode.lazyload.waitTimeout

    説明 デフォルト値
    遅延ロードの検索と取得を開始するまでの最大待機タイムアウト時間(ミリ秒) 30000

    queryNode.lazyload.requestResourceTimeout

    説明 デフォルト値
    遅延ロードのためのリクエストリソースの待ち時間の最大タイムアウト(ミリ秒単位)。 5000

    queryNode.lazyload.requestResourceRetryInterval

    説明 デフォルト値
    遅延ロードのリクエストリソース待ちの再試行間隔 (ミリ秒単位) デフォルト値 2s 2000

    queryNode.lazyload.maxRetryTimes

    説明 デフォルト値
    遅延ロードの最大再試行回数、デフォルトは 1 1

    queryNode.lazyload.maxEvictPerRetry

    説明 デフォルト値
    遅延ロードの最大evict回数、デフォルトは1 1

    queryNode.scheduler.maxReadConcurrentRatio

    説明 デフォルト値
  • maxReadConcurrentRatioは読み取りタスク(検索タスクおよびクエリ・タスク)の同時実行比率です。
  • 最大読み取り同時実行率は、hardware.GetCPUNum * maxReadConcurrentRatioの値となる。
  • デフォルトは2.0であり、これは最大読み取り同時実行率がhardware.GetCPUNum * 2の値になることを意味する。
  • 最大読み取り同時実行数は 1 以上、hardware.GetCPUNum * 100 以下でなければなりません。
  • (0, 100]
  • 1

    queryNode.scheduler.cpuRatio

    説明 デフォルト値
    読み取りタスクの CPU 使用率の見積もりに使用される比率。 10

    queryNode.scheduler.scheduleReadPolicy.name

    説明 デフォルト値
  • fifo:スケジュールをサポートする FIFO キュー。
  • user-task-polling:
  • ユーザーのタスクは1つずつポーリングされ、スケジューリングされる。
  • スケジューリングはタスクの粒度で公平に行われる。
  • ポリシーは、認証のためのユーザー名に基づいている。
  • また、空のユーザー名は同一ユーザーとみなされる。
  • マルチユーザーが存在しない場合、ポリシーはFIFOに減衰する。
  • フィフォ

    queryNode.scheduler.scheduleReadPolicy.taskQueueExpire

    説明 デフォルト値
    キューが空になってから、キューが保持する時間 (何秒) を制御します。 60

    queryNode.scheduler.scheduleReadPolicy.enableCrossUserGrouping

    説明 デフォルト値
    user-task-pollingポリシー使用時に、cross user groupingを有効にする。(ユーザのタスクが互いにマージできない場合は無効にする) false

    queryNode.scheduler.scheduleReadPolicy.maxPendingTaskPerUser

    説明 デフォルト値
    スケジューラでのユーザごとの保留タスクの最大数 1024

    queryNode.dataSync.flowGraph.maxQueueLength

    説明 デフォルト値
    クエリノードのフローグラフのタスクキューキャッシュの最大サイズ。 16

    queryNode.dataSync.flowGraph.maxParallelism

    説明 デフォルト値
    フローグラフ内で並列実行されるタスクの最大数 1024

    queryNode.enableSegmentPrune

    説明 デフォルト値
    シャードデリゲータの検索/クエリでデータをプルーニングするためにパーティション統計を使用する false

    queryNode.bloomFilterApplyParallelFactor

    説明 デフォルト値
    ブルームフィルタにpkを適用する際の並列係数、デフォルトは4*CPU_CORE_NUM 4

    queryNode.queryStreamBatchSize

    説明 デフォルト値
    ストリームクエリのバッチサイズを返す 4194304

    queryNode.workerPooling.size

    説明 デフォルト値
    ワーカークエリノードのクライアントプールのサイズ 10

    queryNode.ip

    説明 デフォルト値
    queryNodeのTCP/IPアドレス。指定されていない場合は、最初のユニキャスト可能なアドレスを使用します。

    queryNode.port

    説明 デフォルト値
    queryNodeのTCPポート 21123

    queryNode.grpc.serverMaxSendSize

    説明 デフォルト値
    queryNodeが送信できる各RPCリクエストの最大サイズ、単位:バイト 536870912

    queryNode.grpc.serverMaxRecvSize

    説明 デフォルト値
    queryNodeが受信できる各RPCリクエストの最大サイズ、単位:バイト 268435456

    queryNode.grpc.clientMaxSendSize

    説明 デフォルト値
    queryNode上のクライアントが送信できる各RPCリクエストの最大サイズ、単位:バイト 268435456

    queryNode.grpc.clientMaxRecvSize

    説明 デフォルト値
    queryNode上のクライアントが受信できる各RPCリクエストの最大サイズ、単位:バイト 536870912

    翻訳DeepLogo

    目次

    Try Managed Milvus for Free

    Zilliz Cloud is hassle-free, powered by Milvus and 10x faster.

    Get Started
    フィードバック

    このページは役に立ちましたか ?