Связанная конфигурация узла queryNode, используемая для выполнения гибридного поиска между векторными и скалярными данными.
Описание |
Значение по умолчанию |
Интервал, через который узел запроса публикует статистическую информацию об узле, включая статус сегмента, использование процессора, памяти, состояние здоровья и т. д. Единица измерения: мс. |
1000 |
Описание |
Значение по умолчанию |
Количество потоков в пуле потоков knowhere. Если диск включен, размер пула будет умножен на knowhereThreadPoolNumRatio([1, 32]). |
4 |
Описание |
Значение по умолчанию |
Количество строк, на которые Segcore делит сегмент на чанки. |
128 |
Описание |
Значение по умолчанию |
Создавать ли временный индекс для растущих сегментов и запечатанных сегментов, которые еще не проиндексированы, улучшая производительность поиска.
В конечном итоге Milvus запечатает и проиндексирует все сегменты, но включение этого параметра оптимизирует производительность поиска для запросов, следующих сразу за вставкой данных.
Значение по умолчанию равно true, что означает, что Milvus создает временный индекс для растущих сегментов и запечатанных сегментов, которые не индексируются при поиске. |
true |
Описание |
Значение по умолчанию |
nlist временного индекса, рекомендуется установить sqrt(chunkRows), должно быть меньше chunkRows/8 |
128 |
Описание |
Значение по умолчанию |
nprobe для поиска небольшого индекса, исходя из ваших требований к точности, должен быть меньше nlist |
16 |
Описание |
Значение по умолчанию |
дополнительная память, необходимая для построения промежуточного индекса |
1.15 |
Описание |
Значение по умолчанию |
отношение параллельного построения промежуточного индекса к числу процессоров |
0.5 |
Описание |
Значение по умолчанию |
Включить множественный поиск в кусках |
true |
Описание |
Значение по умолчанию |
Включить логику вычисления баллов сильной согласованности knowhere |
false |
Описание |
Значение по умолчанию |
Коэффициент умножения для расчета использования памяти при загрузке сегментов |
1 |
Описание |
Значение по умолчанию |
включить загрузку дискового индекса querynode и поиск по дисковому индексу |
false |
Описание |
Значение по умолчанию |
2 ГБ, 2 * 1024 *1024 *1024 |
2147483648 |
Описание |
Значение по умолчанию |
Политика опережающего чтения для кэша чанков, опции: `normal, random, sequential, willneed, dontneed`. |
willneed |
Описание |
Значение по умолчанию |
опции: async, sync, disable.
Указывает необходимость разогрева кэша чанков.
1. Если установлено значение "sync" или "async", исходные векторные данные будут синхронно/асинхронно загружаться в
кэш чанков во время процесса загрузки. Такой подход способен существенно снизить задержку запросов/поиска
на определенное время после загрузки, хотя и сопровождается одновременным увеличением использования диска;
2. Если установить значение "отключить", исходные векторные данные будут загружаться в кэш чанков только во время поиска/запроса. |
отключить |
Описание |
Значение по умолчанию |
Включить mmap для загрузки векторных данных |
false |
Описание |
Значение по умолчанию |
Включить mmap для загрузки индекса вектора |
false |
Описание |
Значение по умолчанию |
Включить mmap для загрузки скалярных данных |
false |
Описание |
Значение по умолчанию |
Включить mmap для загрузки скалярного индекса |
false |
Описание |
Значение по умолчанию |
Включить mmap для кэша чанков (получение сырого вектора). |
true |
Описание |
Значение по умолчанию |
Включите отображение памяти (mmap) для оптимизации обработки растущих необработанных данных.
Активация этой функции позволяет значительно минимизировать затраты памяти, связанные с новыми добавленными или измененными данными.
Однако эта оптимизация может быть достигнута ценой небольшого снижения задержки запросов для затронутых сегментов данных. |
ложный |
Описание |
Значение по умолчанию |
Включить ленивую загрузку для загрузки данных |
false |
Описание |
Значение по умолчанию |
максимальный таймаут ожидания в миллисекундах перед началом выполнения поиска и извлечения данных с помощью ленивой загрузки |
30000 |
Описание |
Значение по умолчанию |
максимальный таймаут в миллисекундах для ожидания запроса ресурса для ленивой загрузки, по умолчанию 5 с |
5000 |
Описание |
Значение по умолчанию |
интервал повторных попыток в миллисекундах для ожидания ресурса запроса для ленивой нагрузки, по умолчанию 2 с |
2000 |
Описание |
Значение по умолчанию |
максимальное время повторных попыток для ленивой нагрузки, по умолчанию 1 |
1 |
Описание |
Значение по умолчанию |
максимальное количество выселений для ленивой нагрузки, по умолчанию 1 |
1 |
Описание |
Значение по умолчанию |
включить кэш смещения индекса для некоторых скалярных индексов, сейчас это только для растровых индексов, включение этого параметра может улучшить производительность при извлечении необработанных данных из индекса |
false |
Описание |
Значение по умолчанию |
maxReadConcurrentRatio - соотношение параллельности задач чтения (задач поиска и запросов).
Максимальный параллелизм чтения будет равен значению hardware.GetCPUNum * maxReadConcurrentRatio.
По умолчанию он равен 2.0, что означает, что максимальный обмен данными при чтении будет равен значению hardware.GetCPUNum * 2.
Максимальный обмен данными при чтении должен быть больше или равен 1 и меньше или равен hardware.GetCPUNum * 100.
(0, 100] |
1 |
Описание |
Значение по умолчанию |
коэффициент, используемый для оценки использования процессора задачей чтения. |
10 |
Описание |
Значение по умолчанию |
fifo: Очередь FIFO, поддерживающая расписание.
user-task-polling:
Задачи пользователя будут опрашиваться по одной и планироваться.
Расписание справедливо для гранулярности задач.
Политика основана на имени пользователя для аутентификации.
Пустое имя пользователя считается одним и тем же пользователем.
Когда нет нескольких пользователей, политика распадается на FIFO". |
fifo |
Описание |
Значение по умолчанию |
Контролирует, как долго (много секунд) сохраняется очередь после того, как она опустела |
60 |
Описание |
Значение по умолчанию |
Включить перекрестную группировку пользователей при использовании политики user-task-polling. (Отключите, если задачи пользователей не могут объединяться друг с другом) |
false |
Описание |
Значение по умолчанию |
Максимальное количество ожидающих задач для одного пользователя в планировщике |
1024 |
Описание |
Значение по умолчанию |
Политика пересылки нулевого удаления на уровне делегата, возможные варианты["FilterByBF", "RemoteLoad"]. |
FilterByBF |
Описание |
Значение по умолчанию |
политика пересылки потокового удаления делегата, возможная опция["FilterByBF", "Direct"] |
FilterByBF |
Описание |
Значение по умолчанию |
Максимальный размер кэша очереди задач в графе потоков в узле запроса. |
16 |
Описание |
Значение по умолчанию |
Максимальное количество параллельно выполняемых задач в графе потока |
1024 |
Описание |
Значение по умолчанию |
использовать статистику разделов для обрезки данных в поиске/запросе на делегаторе осколков |
false |
Описание |
Значение по умолчанию |
возвращать минимальный размер пакета для потокового запроса |
4194304 |
Описание |
Значение по умолчанию |
возврат максимального размера партии для потокового запроса |
134217728 |
Описание |
Значение по умолчанию |
коэффициент параллельности при применении pk к bloom-фильтру, по умолчанию 4*CPU_CORE_NUM |
4 |
Описание |
Значение по умолчанию |
размер клиентского пула рабочих querynode |
10 |
Описание |
Значение по умолчанию |
TCP/IP-адрес узла запроса. Если не указан, используется первый одноадресный адрес. |
|
Описание |
Значение по умолчанию |
TCP-порт узла запроса |
21123 |
Описание |
Значение по умолчанию |
Максимальный размер каждого RPC-запроса, который может отправить узел запроса, единица измерения: байт |
536870912 |
Описание |
Значение по умолчанию |
Максимальный размер каждого RPC-запроса, который может получить узел запроса, единица измерения: байт |
268435456 |
Описание |
Значение по умолчанию |
Максимальный размер каждого RPC-запроса, который могут отправлять клиенты на queryNode, единица измерения: байт |
268435456 |
Описание |
Значение по умолчанию |
Максимальный размер каждого RPC-запроса, который могут получить клиенты на queryNode, единица измерения: байт |
536870912 |