🚀 Essayez Zilliz Cloud, la version entièrement gérée de Milvus, gratuitement—découvrez des performances 10x plus rapides ! Essayez maintenant>>

milvus-logo
LFAI
Home
  • Guide d'administration

Configurations liées à queryNode

Configuration connexe de queryNode, utilisée pour effectuer une recherche hybride entre des données vectorielles et scalaires.

queryNode.stats.publishInterval

Description de la configuration Valeur par défaut
Intervalle pendant lequel le nœud de requête publie les informations statistiques du nœud, y compris l'état du segment, l'utilisation du processeur, l'utilisation de la mémoire, l'état de santé, etc. Unité : ms. 1000

queryNode.segcore.knowhereThreadPoolNumRatio

Description de l'intervalle Valeur par défaut
Le nombre de threads dans le pool de threads de knowhere. Si le disque est activé, la taille du pool sera multipliée par knowhereThreadPoolNumRatio([1, 32]). 4

queryNode.segcore.chunkRows

Description Valeur par défaut
Nombre de lignes par lequel Segcore divise un segment en morceaux. 128

queryNode.segcore.interimIndex.enableIndex

Description de la valeur par défaut Valeur par défaut
  • Création ou non d'un index temporaire pour les segments en croissance et les segments scellés non encore indexés, afin d'améliorer les performances de recherche.
  • Milvus finira par sceller et indexer tous les segments, mais l'activation de cette option optimise les performances de recherche pour les requêtes immédiates après l'insertion des données.
  • La valeur par défaut est true, ce qui indique que Milvus crée un index temporaire pour les segments en croissance et les segments scellés qui ne sont pas indexés lors des recherches.
  • vrai

    queryNode.segcore.interimIndex.nlist

    Description Valeur par défaut
    index temporaire nlist, il est recommandé de définir sqrt(chunkRows), doit être inférieur à chunkRows/8 128

    queryNode.segcore.interimIndex.nprobe

    Description Valeur par défaut
    nprobe pour rechercher un petit index, basé sur votre exigence de précision, doit être inférieur à nlist 16

    queryNode.segcore.interimIndex.memExpansionRate

    Description de la valeur par défaut Valeur par défaut
    mémoire supplémentaire nécessaire à la construction de l'index provisoire 1.15

    queryNode.segcore.interimIndex.buildParallelRate

    Description de la valeur par défaut Valeur par défaut
    le rapport entre la construction de l'index intermédiaire en parallèle et le nombre de processeurs 0.5

    queryNode.segcore.multipleChunkedEnable

    Description de la valeur par défaut Valeur par défaut
    Activer la recherche par morceaux multiples vrai

    queryNode.segcore.knowhereScoreConsistency

    Description Valeur par défaut
    Activer la logique de calcul du score de cohérence forte de Knowhere faux

    queryNode.loadMemoryUsageFactor

    Description Valeur par défaut
    Le facteur de multiplication du calcul de l'utilisation de la mémoire lors du chargement des segments 1

    queryNode.enableDisk

    Description de la valeur par défaut Valeur par défaut
    permet au querynode de charger l'index du disque et d'effectuer une recherche sur l'index du disque faux

    queryNode.cache.memoryLimit

    Description Valeur par défaut
    2 GB, 2 * 1024 *1024 *1024 2147483648

    queryNode.cache.readAheadPolicy

    Description de la valeur par défaut Valeur par défaut
    La politique de lecture anticipée du cache de morceaux, options : `normal, random, sequential, willneed, dontneed` willneed

    queryNode.cache.warmup

    Description Valeur par défaut
  • options : async, sync, disable.
  • Spécifie la nécessité de réchauffer le cache de morceaux.
  • 1. Si la valeur est "sync" ou "async", les données vectorielles originales seront chargées de manière synchrone/asynchrone dans la mémoire cache pendant le chargement.
  • dans le chunk cache pendant le processus de chargement. Cette approche permet de réduire considérablement la latence des requêtes et des recherches pendant une durée déterminée après le chargement.
  • pendant une durée spécifique après le chargement, bien qu'elle s'accompagne d'une augmentation concomitante de l'utilisation du disque ;
  • 2. Si l'option "disable" est choisie, les données vectorielles originales ne seront chargées dans la mémoire cache que pendant la recherche.
  • désactiver

    queryNode.mmap.vectorField

    Description Valeur par défaut
    Activation de mmap pour le chargement des données vectorielles false (faux)

    queryNode.mmap.vectorIndex

    Description Valeur par défaut
    Activation de l'espace mémoire pour le chargement de l'index du vecteur false

    queryNode.mmap.scalarField

    Description Valeur par défaut
    Activer la mémoire tampon pour le chargement des données scalaires false

    queryNode.mmap.scalarIndex

    Description Valeur par défaut
    Activer la mémoire tampon pour le chargement de l'index scalaire faux

    queryNode.mmap.chunkCache

    Description Valeur par défaut
    Active mmap pour le cache de morceaux (récupération de vecteurs bruts). true

    queryNode.mmap.growingMmapEnabled

    Description Valeur par défaut
  • Active le mappage de la mémoire (mmap) pour optimiser la gestion des données brutes croissantes.
  • En activant cette fonction, la surcharge de mémoire associée aux données nouvellement ajoutées ou modifiées sera considérablement réduite.
  • Toutefois, cette optimisation peut se faire au prix d'une légère diminution de la latence des requêtes pour les segments de données concernés.
  • faux

    queryNode.mmap.fixedFileSizeForMmapAlloc

    Description Valeur par défaut
    Taille du fichier tmp pour le gestionnaire de blocs mmap 1

    queryNode.mmap.maxDiskUsagePercentageForMmapAlloc

    Description de la valeur par défaut Valeur par défaut
    pourcentage de disque utilisé par le gestionnaire de blocs mmap 50

    queryNode.lazyload.enabled

    Description de la valeur par défaut Valeur par défaut
    Activer le lazyload pour le chargement des données faux

    queryNode.lazyload.waitTimeout

    Description de la valeur par défaut Valeur par défaut
    délai d'attente maximal durée en millisecondes avant le début de la recherche et de l'extraction par lazyload 30000

    queryNode.lazyload.requestResourceTimeout

    Description de la valeur par défaut Valeur par défaut
    délai maximum en millisecondes pour l'attente d'une ressource pour la charge paresseuse, 5s par défaut 5000

    queryNode.lazyload.requestResourceRetryInterval

    Description de la valeur par défaut Valeur par défaut
    intervalle de réessai en millisecondes pour l'attente d'une demande de ressource pour une charge paresseuse, 2s par défaut 2000

    queryNode.lazyload.maxRetryTimes

    Description de la valeur par défaut Valeur par défaut
    Nombre maximal de tentatives pour la charge paresseuse, 1 par défaut 1

    queryNode.lazyload.maxEvictPerRetry

    Description de la valeur par défaut Valeur par défaut
    max evict count for lazy load, 1 par défaut 1

    queryNode.indexOffsetCacheEnabled

    Description de la valeur par défaut Valeur par défaut
    active le cache de l'offset de l'index pour certains index scalaires, pour l'instant uniquement pour les index bitmap, l'activation de ce paramètre peut améliorer les performances lors de la récupération des données brutes de l'index false

    queryNode.scheduler.maxReadConcurrentRatio

    Description Valeur par défaut
  • maxReadConcurrentRatio est le ratio de simultanéité de la tâche de lecture (tâche de recherche et tâche de requête).
  • La simultanéité de lecture maximale correspond à la valeur de hardware.GetCPUNum * maxReadConcurrentRatio.
  • La valeur par défaut est 2.0, ce qui signifie que la simultanéité de lecture maximale est égale à la valeur de hardware.GetCPUNum * 2.
  • La simultanéité de lecture maximale doit être supérieure ou égale à 1, et inférieure ou égale à hardware.GetCPUNum * 100.
  • (0, 100]
  • 1

    queryNode.scheduler.cpuRatio

    Description de la valeur par défaut Valeur par défaut
    ratio utilisé pour estimer l'utilisation du processeur de la tâche de lecture. 10

    queryNode.scheduler.scheduleReadPolicy.name

    Description de la valeur par défaut Valeur par défaut
  • fifo : Une file d'attente FIFO prend en charge la planification.
  • user-task-polling :
  • Les tâches de l'utilisateur sont interrogées une par une et programmées.
  • L'ordonnancement est équitable en fonction de la granularité des tâches.
  • La politique est basée sur le nom d'utilisateur pour l'authentification.
  • Un nom d'utilisateur vide est considéré comme le même utilisateur.
  • Lorsqu'il n'y a pas de multi-utilisateurs, la politique se décompose en FIFO"
  • fifo

    queryNode.scheduler.scheduleReadPolicy.taskQueueExpire

    Description Valeur par défaut
    Contrôle la durée (en nombre de secondes) pendant laquelle la file d'attente est conservée lorsqu'elle est vide. 60

    queryNode.scheduler.scheduleReadPolicy.enableCrossUserGrouping

    Description Valeur par défaut
    Active le regroupement d'utilisateurs croisés lors de l'utilisation de la politique de sondage des tâches des utilisateurs. (Désactiver si les tâches de l'utilisateur ne peuvent pas être fusionnées) faux

    queryNode.scheduler.scheduleReadPolicy.maxPendingTaskPerUser

    Description Valeur par défaut
    Tâche maximale en attente par utilisateur dans l'ordonnanceur 1024

    queryNode.levelZeroForwardPolicy

    Description de la valeur par défaut Valeur par défaut
    politique de suppression zéro au niveau du délégué, option possible["FilterByBF", "RemoteLoad"]]. FilterByBF

    queryNode.streamingDeltaForwardPolicy

    Description Valeur par défaut
    politique d'effacement en continu du délégateur, option possible["FilterByBF", "Direct"] FilterByBF

    queryNode.dataSync.flowGraph.maxQueueLength

    Description Valeur par défaut
    Taille maximale du cache de la file d'attente des tâches dans le graphe de flux du nœud de requête. 16

    queryNode.dataSync.flowGraph.maxParallelism

    Description Valeur par défaut
    Nombre maximal de tâches exécutées en parallèle dans le graphe de flux 1024

    queryNode.enableSegmentPrune

    Description de la valeur par défaut Valeur par défaut
    Utiliser les statistiques de partition pour élaguer les données dans la recherche/requête sur le délégateur de tessons faux

    queryNode.queryStreamBatchSize

    Description de la valeur par défaut Valeur par défaut
    renvoie la taille minimale du lot de la requête de flux 4194304

    queryNode.queryStreamMaxBatchSize

    Description de la valeur par défaut Valeur par défaut
    renvoie la taille maximale du lot de la requête de flux 134217728

    queryNode.bloomFilterApplyParallelFactor

    Description de la valeur par défaut Valeur par défaut
    facteur parallèle lors de l'application de pk au filtre bloom, par défaut 4*CPU_CORE_NUM 4

    queryNode.workerPooling.size

    Description de la valeur par défaut Valeur par défaut
    la taille du pool de clients du querynode travailleur 10

    queryNode.ip

    Description de la valeur par défaut Valeur par défaut
    Adresse TCP/IP du queryNode. Si elle n'est pas spécifiée, la première adresse non diffusable est utilisée.

    queryNode.port

    Description Valeur par défaut
    Port TCP du nœud de requête 21123

    queryNode.grpc.serverMaxSendSize

    Description de la valeur par défaut Valeur par défaut
    Taille maximale de chaque requête RPC que le queryNode peut envoyer, unité : octet 536870912

    queryNode.grpc.serverMaxRecvSize

    Description de la valeur par défaut Valeur par défaut
    La taille maximale de chaque requête RPC que le queryNode peut recevoir, unité : octet 268435456

    queryNode.grpc.clientMaxSendSize

    Description de la valeur par défaut Valeur par défaut
    La taille maximale de chaque requête RPC que les clients du queryNode peuvent envoyer, unité : byte 268435456

    queryNode.grpc.clientMaxRecvSize

    Description de la valeur par défaut Valeur par défaut
    Taille maximale de chaque requête RPC que les clients du queryNode peuvent recevoir, unité : octet 536870912
    Table de contenu

    Try Managed Milvus for Free

    Zilliz Cloud is hassle-free, powered by Milvus and 10x faster.

    Get Started
    Feedback

    Cette page a-t - elle été utile ?