ベクトルデータとスカラーデータのハイブリッド検索を実行するために使用されるqueryNodeの関連コンフィギュレーション。
説明 |
デフォルト値 |
クエリ・ノードがセグメント・ステータス、CPU使用率、メモリ使用率、ヘルス・ステータスなどのノード統計情報を公開する間隔。単位:ms |
1000 |
説明 |
デフォルト値 |
knowhere のスレッド・プールのスレッド数。ディスクが有効な場合、プール・サイズは knowhereThreadPoolNumRatio([1, 32])と乗算されます。 |
4 |
説明 |
デフォルト値 |
Segcoreがセグメントをチャンクに分割する行数。 |
128 |
説明 |
デフォルト値 |
成長しているセグメントやまだインデックスが作成されていないセグメントに対して一時的なインデックスを作成し、検索性能を向上させるかどうか。
Milvusは最終的にすべてのセグメントを封印し、インデックスを作成しますが、これを有効にすると、データ挿入直後のクエリの検索パフォーマンスが最適化されます。
デフォルトは true で、Milvus は成長しているセグメントとまだインデックスが作成されていないセグメントに対して一時インデックスを作成します。 |
true |
説明 |
デフォルト値 |
一時インデックスnlist、sqrt(chunkRows)を設定することを推奨。 |
128 |
説明 |
デフォルト値 |
小さなインデックスを検索するためのnprobe。 |
16 |
説明 |
デフォルト値 |
中間インデックスの構築に必要な余分なメモリ |
1.15 |
説明 |
デフォルト値 |
中間インデックスの並列構築とCPU数の比率 |
0.5 |
説明 |
デフォルト値 |
Knowhere 強一貫性スコア計算ロジックを有効にする |
偽 |
説明 |
デフォルト値 |
セグメントをロードする際のメモリ使用量を計算する倍率 |
1 |
説明 |
デフォルト値 |
querynodeがディスクインデックスをロードし、ディスクインデックスを検索することを有効にする。 |
false |
説明 |
デフォルト値 |
2 GB、2 * 1024 * 1024 * 1024 |
2147483648 |
説明 |
デフォルト値 |
チャンクキャッシュの先読みポリシー:normal、random、sequential、willneed、dontneed`。 |
ウィルニード |
説明 |
デフォルト値 |
オプション: async、sync、disable。
チャンクキャッシュのウォームアップの必要性を指定する。
1.sync "または "async "に設定された場合、オリジナルのベクトル・データはロード処理中に同期/非同期でチャンク・キャッシュにロードされる。
チャンクキャッシュに同期/非同期でロードされる。このアプローチは、ロード後の特定の期間、クエリ/検索の待ち時間を大幅に短縮する可能性がある。
を大幅に短縮する可能性がある。ただし、同時にディスク使用量が増加する;
2.disable "に設定すると、オリジナルのベクターデータは検索/クエリ中にのみチャンクキャッシュにロードされます。 |
無効 |
説明 |
デフォルト値 |
データをロードするためにmmapを有効にする |
false |
説明 |
デフォルト値 |
生データを成長させるためにmmapを使用可能にする |
false |
説明 |
デフォルト値 |
データのロードに遅延ロードを有効にする |
false |
説明 |
デフォルト値 |
遅延ロードの検索と取得を開始するまでの最大待機タイムアウト時間(ミリ秒) |
30000 |
説明 |
デフォルト値 |
遅延ロードのためのリクエストリソースの待ち時間の最大タイムアウト(ミリ秒単位)。 |
5000 |
説明 |
デフォルト値 |
遅延ロードのリクエストリソース待ちの再試行間隔 (ミリ秒単位) デフォルト値 2s |
2000 |
説明 |
デフォルト値 |
遅延ロードの最大再試行回数、デフォルトは 1 |
1 |
説明 |
デフォルト値 |
遅延ロードの最大evict回数、デフォルトは1 |
1 |
説明 |
デフォルト値 |
maxReadConcurrentRatioは読み取りタスク(検索タスクおよびクエリ・タスク)の同時実行比率です。
最大読み取り同時実行率は、hardware.GetCPUNum * maxReadConcurrentRatioの値となる。
デフォルトは2.0であり、これは最大読み取り同時実行率がhardware.GetCPUNum * 2の値になることを意味する。
最大読み取り同時実行数は 1 以上、hardware.GetCPUNum * 100 以下でなければなりません。
(0, 100] |
1 |
説明 |
デフォルト値 |
読み取りタスクの CPU 使用率の見積もりに使用される比率。 |
10 |
説明 |
デフォルト値 |
fifo:スケジュールをサポートする FIFO キュー。
user-task-polling:
ユーザーのタスクは1つずつポーリングされ、スケジューリングされる。
スケジューリングはタスクの粒度で公平に行われる。
ポリシーは、認証のためのユーザー名に基づいている。
また、空のユーザー名は同一ユーザーとみなされる。
マルチユーザーが存在しない場合、ポリシーはFIFOに減衰する。 |
フィフォ |
説明 |
デフォルト値 |
キューが空になってから、キューが保持する時間 (何秒) を制御します。 |
60 |
説明 |
デフォルト値 |
user-task-pollingポリシー使用時に、cross user groupingを有効にする。(ユーザのタスクが互いにマージできない場合は無効にする) |
false |
説明 |
デフォルト値 |
スケジューラでのユーザごとの保留タスクの最大数 |
1024 |
説明 |
デフォルト値 |
クエリノードのフローグラフのタスクキューキャッシュの最大サイズ。 |
16 |
説明 |
デフォルト値 |
フローグラフ内で並列実行されるタスクの最大数 |
1024 |
説明 |
デフォルト値 |
シャードデリゲータの検索/クエリでデータをプルーニングするためにパーティション統計を使用する |
false |
説明 |
デフォルト値 |
ブルームフィルタにpkを適用する際の並列係数、デフォルトは4*CPU_CORE_NUM |
4 |
説明 |
デフォルト値 |
ストリームクエリのバッチサイズを返す |
4194304 |
説明 |
デフォルト値 |
ワーカークエリノードのクライアントプールのサイズ |
10 |
説明 |
デフォルト値 |
queryNodeのTCP/IPアドレス。指定されていない場合は、最初のユニキャスト可能なアドレスを使用します。 |
|
説明 |
デフォルト値 |
queryNodeのTCPポート |
21123 |
説明 |
デフォルト値 |
queryNodeが送信できる各RPCリクエストの最大サイズ、単位:バイト |
536870912 |
説明 |
デフォルト値 |
queryNodeが受信できる各RPCリクエストの最大サイズ、単位:バイト |
268435456 |
説明 |
デフォルト値 |
queryNode上のクライアントが送信できる各RPCリクエストの最大サイズ、単位:バイト |
268435456 |
説明 |
デフォルト値 |
queryNode上のクライアントが受信できる各RPCリクエストの最大サイズ、単位:バイト |
536870912 |