🚀 Попробуйте Zilliz Cloud, полностью управляемый Milvus, бесплатно — ощутите 10-кратное увеличение производительности! Попробовать сейчас>

milvus-logo
LFAI
Главная
  • Руководство по администрированию

Конфигурации, связанные с queryNode

Связанная конфигурация узла queryNode, используемая для выполнения гибридного поиска между векторными и скалярными данными.

queryNode.stats.publishInterval

Описание Значение по умолчанию
Интервал, через который узел запроса публикует статистическую информацию об узле, включая статус сегмента, использование процессора, памяти, состояние здоровья и т. д. Единица измерения: мс. 1000

queryNode.segcore.knowhereThreadPoolNumRatio

Описание Значение по умолчанию
Количество потоков в пуле потоков knowhere. Если диск включен, размер пула будет умножен на knowhereThreadPoolNumRatio([1, 32]). 4

queryNode.segcore.chunkRows

Описание Значение по умолчанию
Количество строк, на которые Segcore делит сегмент на чанки. 128

queryNode.segcore.interimIndex.enableIndex

Описание Значение по умолчанию
  • Создавать ли временный индекс для растущих сегментов и запечатанных сегментов, которые еще не проиндексированы, улучшая производительность поиска.
  • В конечном итоге Milvus запечатает и проиндексирует все сегменты, но включение этого параметра оптимизирует производительность поиска для запросов, следующих сразу за вставкой данных.
  • Значение по умолчанию равно true, что означает, что Milvus создает временный индекс для растущих сегментов и запечатанных сегментов, которые не индексируются при поиске.
  • true

    queryNode.segcore.interimIndex.nlist

    Описание Значение по умолчанию
    nlist временного индекса, рекомендуется установить sqrt(chunkRows), должно быть меньше chunkRows/8 128

    queryNode.segcore.interimIndex.nprobe

    Описание Значение по умолчанию
    nprobe для поиска небольшого индекса, исходя из ваших требований к точности, должен быть меньше nlist 16

    queryNode.segcore.interimIndex.memExpansionRate

    Описание Значение по умолчанию
    дополнительная память, необходимая для построения промежуточного индекса 1.15

    queryNode.segcore.interimIndex.buildParallelRate

    Описание Значение по умолчанию
    отношение параллельного построения промежуточного индекса к числу процессоров 0.5

    queryNode.segcore.multipleChunkedEnable

    Описание Значение по умолчанию
    Включить множественный поиск в кусках true

    queryNode.segcore.knowhereScoreConsistency

    Описание Значение по умолчанию
    Включить логику вычисления баллов сильной согласованности knowhere false

    queryNode.loadMemoryUsageFactor

    Описание Значение по умолчанию
    Коэффициент умножения для расчета использования памяти при загрузке сегментов 1

    queryNode.enableDisk

    Описание Значение по умолчанию
    включить загрузку дискового индекса querynode и поиск по дисковому индексу false

    queryNode.cache.memoryLimit

    Описание Значение по умолчанию
    2 ГБ, 2 * 1024 *1024 *1024 2147483648

    queryNode.cache.readAheadPolicy

    Описание Значение по умолчанию
    Политика опережающего чтения для кэша чанков, опции: `normal, random, sequential, willneed, dontneed`. willneed

    queryNode.cache.warmup

    Описание Значение по умолчанию
  • опции: async, sync, disable.
  • Указывает необходимость разогрева кэша чанков.
  • 1. Если установлено значение "sync" или "async", исходные векторные данные будут синхронно/асинхронно загружаться в
  • кэш чанков во время процесса загрузки. Такой подход способен существенно снизить задержку запросов/поиска
  • на определенное время после загрузки, хотя и сопровождается одновременным увеличением использования диска;
  • 2. Если установить значение "отключить", исходные векторные данные будут загружаться в кэш чанков только во время поиска/запроса.
  • отключить

    queryNode.mmap.vectorField

    Описание Значение по умолчанию
    Включить mmap для загрузки векторных данных false

    queryNode.mmap.vectorIndex

    Описание Значение по умолчанию
    Включить mmap для загрузки индекса вектора false

    queryNode.mmap.scalarField

    Описание Значение по умолчанию
    Включить mmap для загрузки скалярных данных false

    queryNode.mmap.scalarIndex

    Описание Значение по умолчанию
    Включить mmap для загрузки скалярного индекса false

    queryNode.mmap.chunkCache

    Описание Значение по умолчанию
    Включить mmap для кэша чанков (получение сырого вектора). true

    queryNode.mmap.growingMmapEnabled

    Описание Значение по умолчанию
  • Включите отображение памяти (mmap) для оптимизации обработки растущих необработанных данных.
  • Активация этой функции позволяет значительно минимизировать затраты памяти, связанные с новыми добавленными или измененными данными.
  • Однако эта оптимизация может быть достигнута ценой небольшого снижения задержки запросов для затронутых сегментов данных.
  • ложный

    queryNode.mmap.fixedFileSizeForMmapAlloc

    Описание Значение по умолчанию
    Размер tmp-файла для менеджера чанков mmap 1

    queryNode.mmap.maxDiskUsagePercentageForMmapAlloc

    Описание Значение по умолчанию
    процент диска, используемый в менеджере чанков mmap 50

    queryNode.lazyload.enabled

    Описание Значение по умолчанию
    Включить ленивую загрузку для загрузки данных false

    queryNode.lazyload.waitTimeout

    Описание Значение по умолчанию
    максимальный таймаут ожидания в миллисекундах перед началом выполнения поиска и извлечения данных с помощью ленивой загрузки 30000

    queryNode.lazyload.requestResourceTimeout

    Описание Значение по умолчанию
    максимальный таймаут в миллисекундах для ожидания запроса ресурса для ленивой загрузки, по умолчанию 5 с 5000

    queryNode.lazyload.requestResourceRetryInterval

    Описание Значение по умолчанию
    интервал повторных попыток в миллисекундах для ожидания ресурса запроса для ленивой нагрузки, по умолчанию 2 с 2000

    queryNode.lazyload.maxRetryTimes

    Описание Значение по умолчанию
    максимальное время повторных попыток для ленивой нагрузки, по умолчанию 1 1

    queryNode.lazyload.maxEvictPerRetry

    Описание Значение по умолчанию
    максимальное количество выселений для ленивой нагрузки, по умолчанию 1 1

    queryNode.indexOffsetCacheEnabled

    Описание Значение по умолчанию
    включить кэш смещения индекса для некоторых скалярных индексов, сейчас это только для растровых индексов, включение этого параметра может улучшить производительность при извлечении необработанных данных из индекса false

    queryNode.scheduler.maxReadConcurrentRatio

    Описание Значение по умолчанию
  • maxReadConcurrentRatio - соотношение параллельности задач чтения (задач поиска и запросов).
  • Максимальный параллелизм чтения будет равен значению hardware.GetCPUNum * maxReadConcurrentRatio.
  • По умолчанию он равен 2.0, что означает, что максимальный обмен данными при чтении будет равен значению hardware.GetCPUNum * 2.
  • Максимальный обмен данными при чтении должен быть больше или равен 1 и меньше или равен hardware.GetCPUNum * 100.
  • (0, 100]
  • 1

    queryNode.scheduler.cpuRatio

    Описание Значение по умолчанию
    коэффициент, используемый для оценки использования процессора задачей чтения. 10

    queryNode.scheduler.scheduleReadPolicy.name

    Описание Значение по умолчанию
  • fifo: Очередь FIFO, поддерживающая расписание.
  • user-task-polling:
  • Задачи пользователя будут опрашиваться по одной и планироваться.
  • Расписание справедливо для гранулярности задач.
  • Политика основана на имени пользователя для аутентификации.
  • Пустое имя пользователя считается одним и тем же пользователем.
  • Когда нет нескольких пользователей, политика распадается на FIFO".
  • fifo

    queryNode.scheduler.scheduleReadPolicy.taskQueueExpire

    Описание Значение по умолчанию
    Контролирует, как долго (много секунд) сохраняется очередь после того, как она опустела 60

    queryNode.scheduler.scheduleReadPolicy.enableCrossUserGrouping

    Описание Значение по умолчанию
    Включить перекрестную группировку пользователей при использовании политики user-task-polling. (Отключите, если задачи пользователей не могут объединяться друг с другом) false

    queryNode.scheduler.scheduleReadPolicy.maxPendingTaskPerUser

    Описание Значение по умолчанию
    Максимальное количество ожидающих задач для одного пользователя в планировщике 1024

    queryNode.levelZeroForwardPolicy

    Описание Значение по умолчанию
    Политика пересылки нулевого удаления на уровне делегата, возможные варианты["FilterByBF", "RemoteLoad"]. FilterByBF

    queryNode.streamingDeltaForwardPolicy

    Описание Значение по умолчанию
    политика пересылки потокового удаления делегата, возможная опция["FilterByBF", "Direct"] FilterByBF

    queryNode.dataSync.flowGraph.maxQueueLength

    Описание Значение по умолчанию
    Максимальный размер кэша очереди задач в графе потоков в узле запроса. 16

    queryNode.dataSync.flowGraph.maxParallelism

    Описание Значение по умолчанию
    Максимальное количество параллельно выполняемых задач в графе потока 1024

    queryNode.enableSegmentPrune

    Описание Значение по умолчанию
    использовать статистику разделов для обрезки данных в поиске/запросе на делегаторе осколков false

    queryNode.queryStreamBatchSize

    Описание Значение по умолчанию
    возвращать минимальный размер пакета для потокового запроса 4194304

    queryNode.queryStreamMaxBatchSize

    Описание Значение по умолчанию
    возврат максимального размера партии для потокового запроса 134217728

    queryNode.bloomFilterApplyParallelFactor

    Описание Значение по умолчанию
    коэффициент параллельности при применении pk к bloom-фильтру, по умолчанию 4*CPU_CORE_NUM 4

    queryNode.workerPooling.size

    Описание Значение по умолчанию
    размер клиентского пула рабочих querynode 10

    queryNode.ip

    Описание Значение по умолчанию
    TCP/IP-адрес узла запроса. Если не указан, используется первый одноадресный адрес.

    queryNode.port

    Описание Значение по умолчанию
    TCP-порт узла запроса 21123

    queryNode.grpc.serverMaxSendSize

    Описание Значение по умолчанию
    Максимальный размер каждого RPC-запроса, который может отправить узел запроса, единица измерения: байт 536870912

    queryNode.grpc.serverMaxRecvSize

    Описание Значение по умолчанию
    Максимальный размер каждого RPC-запроса, который может получить узел запроса, единица измерения: байт 268435456

    queryNode.grpc.clientMaxSendSize

    Описание Значение по умолчанию
    Максимальный размер каждого RPC-запроса, который могут отправлять клиенты на queryNode, единица измерения: байт 268435456

    queryNode.grpc.clientMaxRecvSize

    Описание Значение по умолчанию
    Максимальный размер каждого RPC-запроса, который могут получить клиенты на queryNode, единица измерения: байт 536870912
    Содержание

    Попробуйте Managed Milvus бесплатно

    Zilliz Cloud работает без проблем, поддерживается Milvus и в 10 раз быстрее.

    Начать
    Обратная связь

    Была ли эта страница полезной?