milvus-logo
LFAI
Home
  • Guide d'administration

Configurations liées à queryNode

Configuration connexe de queryNode, utilisée pour effectuer une recherche hybride entre des données vectorielles et scalaires.

queryNode.stats.publishInterval

Description de la configuration Valeur par défaut
Intervalle pendant lequel le nœud de requête publie les informations statistiques du nœud, y compris l'état du segment, l'utilisation du processeur, l'utilisation de la mémoire, l'état de santé, etc. Unité : ms. 1000

queryNode.segcore.knowhereThreadPoolNumRatio

Description Valeur par défaut
Le nombre de threads dans le pool de threads de knowhere. Si le disque est activé, la taille du pool sera multipliée par knowhereThreadPoolNumRatio([1, 32]). 4

queryNode.segcore.chunkRows

Description Valeur par défaut
Nombre de lignes par lequel Segcore divise un segment en morceaux. 128

queryNode.segcore.interimIndex.enableIndex

Description de la valeur par défaut Valeur par défaut
  • Création ou non d'un index temporaire pour les segments en croissance et les segments scellés non encore indexés, afin d'améliorer les performances de recherche.
  • Milvus finira par sceller et indexer tous les segments, mais l'activation de cette option optimise les performances de recherche pour les requêtes immédiates après l'insertion des données.
  • La valeur par défaut est true, ce qui indique que Milvus crée un index temporaire pour les segments en croissance et les segments scellés qui ne sont pas indexés lors des recherches.
  • vrai

    queryNode.segcore.interimIndex.nlist

    Description Valeur par défaut
    index temporaire nlist, il est recommandé de définir sqrt(chunkRows), doit être inférieur à chunkRows/8 128

    queryNode.segcore.interimIndex.nprobe

    Description Valeur par défaut
    nprobe pour rechercher un petit index, basé sur votre exigence de précision, doit être inférieur à nlist 16

    queryNode.segcore.interimIndex.memExpansionRate

    Description de la valeur par défaut Valeur par défaut
    mémoire supplémentaire nécessaire à la construction de l'index provisoire 1.15

    queryNode.segcore.interimIndex.buildParallelRate

    Description de la valeur par défaut Valeur par défaut
    le rapport entre la construction de l'index intermédiaire en parallèle et le nombre de processeurs 0.5

    queryNode.segcore.knowhereScoreConsistency

    Description de la valeur par défaut Valeur par défaut
    Activer la logique de calcul du score de cohérence forte de Knowhere faux

    queryNode.loadMemoryUsageFactor

    Description Valeur par défaut
    Le facteur de multiplication du calcul de l'utilisation de la mémoire lors du chargement des segments 1

    queryNode.enableDisk

    Description de la valeur par défaut Valeur par défaut
    permet au querynode de charger l'index du disque et d'effectuer une recherche sur l'index du disque faux

    queryNode.cache.memoryLimit

    Description Valeur par défaut
    2 GB, 2 * 1024 *1024 *1024 2147483648

    queryNode.cache.readAheadPolicy

    Description de la valeur par défaut Valeur par défaut
    La politique de lecture anticipée du cache de morceaux, options : `normal, random, sequential, willneed, dontneed` willneed

    queryNode.cache.warmup

    Description Valeur par défaut
  • options : async, sync, disable.
  • Spécifie la nécessité de réchauffer le cache de morceaux.
  • 1. Si la valeur est "sync" ou "async", les données vectorielles originales seront chargées de manière synchrone/asynchrone dans la mémoire cache pendant le chargement.
  • dans le chunk cache pendant le processus de chargement. Cette approche permet de réduire considérablement la latence des requêtes et des recherches pendant une durée déterminée après le chargement.
  • pendant une durée spécifique après le chargement, bien qu'elle s'accompagne d'une augmentation concomitante de l'utilisation du disque ;
  • 2. Si l'option "disable" est choisie, les données vectorielles originales ne seront chargées dans la mémoire cache que pendant la recherche.
  • désactiver

    queryNode.mmap.mmapEnabled

    Description Valeur par défaut
    Active la mémoire tampon pour le chargement des données false (faux)

    queryNode.mmap.growingMmapEnabled

    Description Valeur par défaut
    Activer la mémoire tampon pour l'utilisation des données brutes en cours de croissance false

    queryNode.mmap.fixedFileSizeForMmapAlloc

    Description Valeur par défaut
    Taille du fichier tmp pour le gestionnaire de blocs mmap 1

    queryNode.mmap.maxDiskUsagePercentageForMmapAlloc

    Description de la valeur par défaut Valeur par défaut
    pourcentage de disque utilisé par le gestionnaire de blocs mmap 50

    queryNode.lazyload.enabled

    Description de la valeur par défaut Valeur par défaut
    Activer le lazyload pour le chargement des données faux

    queryNode.lazyload.waitTimeout

    Description de la valeur par défaut Valeur par défaut
    délai d'attente maximal durée en millisecondes avant le début de la recherche et de l'extraction par lazyload 30000

    queryNode.lazyload.requestResourceTimeout

    Description de la valeur par défaut Valeur par défaut
    délai maximum en millisecondes pour l'attente d'une ressource pour la charge paresseuse, 5s par défaut 5000

    queryNode.lazyload.requestResourceRetryInterval

    Description de la valeur par défaut Valeur par défaut
    intervalle de réessai en millisecondes pour l'attente d'une demande de ressource pour une charge paresseuse, 2s par défaut 2000

    queryNode.lazyload.maxRetryTimes

    Description de la valeur par défaut Valeur par défaut
    Nombre maximal de tentatives pour la charge paresseuse, 1 par défaut 1

    queryNode.lazyload.maxEvictPerRetry

    Description de la valeur par défaut Valeur par défaut
    max evict count for lazy load, 1 par défaut 1

    queryNode.scheduler.maxReadConcurrentRatio

    Description de la valeur par défaut Valeur par défaut
  • maxReadConcurrentRatio est le taux de simultanéité de la tâche de lecture (tâche de recherche et tâche de requête).
  • La simultanéité de lecture maximale correspond à la valeur de hardware.GetCPUNum * maxReadConcurrentRatio.
  • La valeur par défaut est 2.0, ce qui signifie que la simultanéité de lecture maximale est égale à la valeur de hardware.GetCPUNum * 2.
  • La simultanéité de lecture maximale doit être supérieure ou égale à 1, et inférieure ou égale à hardware.GetCPUNum * 100.
  • (0, 100]
  • 1

    queryNode.scheduler.cpuRatio

    Description de la valeur par défaut Valeur par défaut
    ratio utilisé pour estimer l'utilisation du processeur de la tâche de lecture. 10

    queryNode.scheduler.scheduleReadPolicy.name

    Description de la valeur par défaut Valeur par défaut
  • fifo : Une file d'attente FIFO prend en charge la planification.
  • user-task-polling :
  • Les tâches de l'utilisateur sont interrogées une par une et programmées.
  • L'ordonnancement est équitable en fonction de la granularité des tâches.
  • La politique est basée sur le nom d'utilisateur pour l'authentification.
  • Un nom d'utilisateur vide est considéré comme le même utilisateur.
  • Lorsqu'il n'y a pas de multi-utilisateurs, la politique se décompose en FIFO"
  • fifo

    queryNode.scheduler.scheduleReadPolicy.taskQueueExpire

    Description Valeur par défaut
    Contrôle la durée (en nombre de secondes) pendant laquelle la file d'attente est conservée lorsqu'elle est vide. 60

    queryNode.scheduler.scheduleReadPolicy.enableCrossUserGrouping

    Description Valeur par défaut
    Active le regroupement d'utilisateurs croisés lors de l'utilisation de la politique de sondage des tâches des utilisateurs. (Désactiver si les tâches de l'utilisateur ne peuvent pas être fusionnées) faux

    queryNode.scheduler.scheduleReadPolicy.maxPendingTaskPerUser

    Description Valeur par défaut
    Tâche maximale en attente par utilisateur dans l'ordonnanceur 1024

    queryNode.dataSync.flowGraph.maxQueueLength

    Description de la valeur par défaut Valeur par défaut
    Taille maximale du cache de la file d'attente des tâches dans le graphe de flux du nœud de requête. 16

    queryNode.dataSync.flowGraph.maxParallelism

    Description Valeur par défaut
    Nombre maximal de tâches exécutées en parallèle dans le graphe de flux 1024

    queryNode.enableSegmentPrune

    Description de la valeur par défaut Valeur par défaut
    Utiliser les statistiques de partition pour élaguer les données dans la recherche/requête sur le délégateur de tessons faux

    queryNode.bloomFilterApplyParallelFactor

    Description de la valeur par défaut Valeur par défaut
    facteur parallèle lors de l'application du pk au filtre bloom, par défaut 4*CPU_CORE_NUM 4

    queryNode.queryStreamBatchSize

    Description de la valeur par défaut Valeur par défaut
    taille du lot de retour de la requête de flux 4194304

    queryNode.workerPooling.size

    Description de la valeur par défaut Valeur par défaut
    la taille du pool de clients du nœud de requête du travailleur 10

    queryNode.ip

    Description de la valeur par défaut Valeur par défaut
    Adresse TCP/IP du queryNode. Si elle n'est pas spécifiée, la première adresse non diffusable est utilisée.

    queryNode.port

    Description Valeur par défaut
    Port TCP du nœud de requête 21123

    queryNode.grpc.serverMaxSendSize

    Description de la valeur par défaut Valeur par défaut
    Taille maximale de chaque requête RPC que le queryNode peut envoyer, unité : octet 536870912

    queryNode.grpc.serverMaxRecvSize

    Description de la valeur par défaut Valeur par défaut
    La taille maximale de chaque requête RPC que le queryNode peut recevoir, unité : octet 268435456

    queryNode.grpc.clientMaxSendSize

    Description de la valeur par défaut Valeur par défaut
    La taille maximale de chaque requête RPC que les clients du queryNode peuvent envoyer, unité : byte 268435456

    queryNode.grpc.clientMaxRecvSize

    Description de la valeur par défaut Valeur par défaut
    Taille maximale de chaque requête RPC que les clients du queryNode peuvent recevoir, unité : octet 536870912

    Traduit parDeepL

    Table de contenu

    Try Managed Milvus for Free

    Zilliz Cloud is hassle-free, powered by Milvus and 10x faster.

    Get Started
    Feedback

    Cette page a-t - elle été utile ?