Configuration connexe de queryNode, utilisée pour effectuer une recherche hybride entre des données vectorielles et scalaires.
Description de la configuration |
Valeur par défaut |
Intervalle pendant lequel le nœud de requête publie les informations statistiques du nœud, y compris l'état du segment, l'utilisation du processeur, l'utilisation de la mémoire, l'état de santé, etc. Unité : ms. |
1000 |
Description de l'intervalle |
Valeur par défaut |
Le nombre de threads dans le pool de threads de knowhere. Si le disque est activé, la taille du pool sera multipliée par knowhereThreadPoolNumRatio([1, 32]). |
4 |
Description |
Valeur par défaut |
Nombre de lignes par lequel Segcore divise un segment en morceaux. |
128 |
Description de la valeur par défaut |
Valeur par défaut |
Création ou non d'un index temporaire pour les segments en croissance et les segments scellés non encore indexés, afin d'améliorer les performances de recherche.
Milvus finira par sceller et indexer tous les segments, mais l'activation de cette option optimise les performances de recherche pour les requêtes immédiates après l'insertion des données.
La valeur par défaut est true, ce qui indique que Milvus crée un index temporaire pour les segments en croissance et les segments scellés qui ne sont pas indexés lors des recherches. |
vrai |
Description |
Valeur par défaut |
index temporaire nlist, il est recommandé de définir sqrt(chunkRows), doit être inférieur à chunkRows/8 |
128 |
Description |
Valeur par défaut |
nprobe pour rechercher un petit index, basé sur votre exigence de précision, doit être inférieur à nlist |
16 |
Description de la valeur par défaut |
Valeur par défaut |
mémoire supplémentaire nécessaire à la construction de l'index provisoire |
1.15 |
Description de la valeur par défaut |
Valeur par défaut |
le rapport entre la construction de l'index intermédiaire en parallèle et le nombre de processeurs |
0.5 |
Description de la valeur par défaut |
Valeur par défaut |
Activer la recherche par morceaux multiples |
vrai |
Description |
Valeur par défaut |
Activer la logique de calcul du score de cohérence forte de Knowhere |
faux |
Description |
Valeur par défaut |
Le facteur de multiplication du calcul de l'utilisation de la mémoire lors du chargement des segments |
1 |
Description de la valeur par défaut |
Valeur par défaut |
permet au querynode de charger l'index du disque et d'effectuer une recherche sur l'index du disque |
faux |
Description |
Valeur par défaut |
2 GB, 2 * 1024 *1024 *1024 |
2147483648 |
Description de la valeur par défaut |
Valeur par défaut |
La politique de lecture anticipée du cache de morceaux, options : `normal, random, sequential, willneed, dontneed` |
willneed |
Description |
Valeur par défaut |
options : async, sync, disable.
Spécifie la nécessité de réchauffer le cache de morceaux.
1. Si la valeur est "sync" ou "async", les données vectorielles originales seront chargées de manière synchrone/asynchrone dans la mémoire cache pendant le chargement.
dans le chunk cache pendant le processus de chargement. Cette approche permet de réduire considérablement la latence des requêtes et des recherches pendant une durée déterminée après le chargement.
pendant une durée spécifique après le chargement, bien qu'elle s'accompagne d'une augmentation concomitante de l'utilisation du disque ;
2. Si l'option "disable" est choisie, les données vectorielles originales ne seront chargées dans la mémoire cache que pendant la recherche. |
désactiver |
Description |
Valeur par défaut |
Activation de mmap pour le chargement des données vectorielles |
false (faux) |
Description |
Valeur par défaut |
Activation de l'espace mémoire pour le chargement de l'index du vecteur |
false |
Description |
Valeur par défaut |
Activer la mémoire tampon pour le chargement des données scalaires |
false |
Description |
Valeur par défaut |
Activer la mémoire tampon pour le chargement de l'index scalaire |
faux |
Description |
Valeur par défaut |
Active mmap pour le cache de morceaux (récupération de vecteurs bruts). |
true |
Description |
Valeur par défaut |
Active le mappage de la mémoire (mmap) pour optimiser la gestion des données brutes croissantes.
En activant cette fonction, la surcharge de mémoire associée aux données nouvellement ajoutées ou modifiées sera considérablement réduite.
Toutefois, cette optimisation peut se faire au prix d'une légère diminution de la latence des requêtes pour les segments de données concernés. |
faux |
Description de la valeur par défaut |
Valeur par défaut |
Activer le lazyload pour le chargement des données |
faux |
Description de la valeur par défaut |
Valeur par défaut |
délai d'attente maximal durée en millisecondes avant le début de la recherche et de l'extraction par lazyload |
30000 |
Description de la valeur par défaut |
Valeur par défaut |
délai maximum en millisecondes pour l'attente d'une ressource pour la charge paresseuse, 5s par défaut |
5000 |
Description de la valeur par défaut |
Valeur par défaut |
intervalle de réessai en millisecondes pour l'attente d'une demande de ressource pour une charge paresseuse, 2s par défaut |
2000 |
Description de la valeur par défaut |
Valeur par défaut |
Nombre maximal de tentatives pour la charge paresseuse, 1 par défaut |
1 |
Description de la valeur par défaut |
Valeur par défaut |
max evict count for lazy load, 1 par défaut |
1 |
Description de la valeur par défaut |
Valeur par défaut |
active le cache de l'offset de l'index pour certains index scalaires, pour l'instant uniquement pour les index bitmap, l'activation de ce paramètre peut améliorer les performances lors de la récupération des données brutes de l'index |
false |
Description |
Valeur par défaut |
maxReadConcurrentRatio est le ratio de simultanéité de la tâche de lecture (tâche de recherche et tâche de requête).
La simultanéité de lecture maximale correspond à la valeur de hardware.GetCPUNum * maxReadConcurrentRatio.
La valeur par défaut est 2.0, ce qui signifie que la simultanéité de lecture maximale est égale à la valeur de hardware.GetCPUNum * 2.
La simultanéité de lecture maximale doit être supérieure ou égale à 1, et inférieure ou égale à hardware.GetCPUNum * 100.
(0, 100] |
1 |
Description de la valeur par défaut |
Valeur par défaut |
ratio utilisé pour estimer l'utilisation du processeur de la tâche de lecture. |
10 |
Description de la valeur par défaut |
Valeur par défaut |
fifo : Une file d'attente FIFO prend en charge la planification.
user-task-polling :
Les tâches de l'utilisateur sont interrogées une par une et programmées.
L'ordonnancement est équitable en fonction de la granularité des tâches.
La politique est basée sur le nom d'utilisateur pour l'authentification.
Un nom d'utilisateur vide est considéré comme le même utilisateur.
Lorsqu'il n'y a pas de multi-utilisateurs, la politique se décompose en FIFO" |
fifo |
Description |
Valeur par défaut |
Contrôle la durée (en nombre de secondes) pendant laquelle la file d'attente est conservée lorsqu'elle est vide. |
60 |
Description |
Valeur par défaut |
Active le regroupement d'utilisateurs croisés lors de l'utilisation de la politique de sondage des tâches des utilisateurs. (Désactiver si les tâches de l'utilisateur ne peuvent pas être fusionnées) |
faux |
Description |
Valeur par défaut |
Tâche maximale en attente par utilisateur dans l'ordonnanceur |
1024 |
Description de la valeur par défaut |
Valeur par défaut |
politique de suppression zéro au niveau du délégué, option possible["FilterByBF", "RemoteLoad"]]. |
FilterByBF |
Description |
Valeur par défaut |
politique d'effacement en continu du délégateur, option possible["FilterByBF", "Direct"] |
FilterByBF |
Description |
Valeur par défaut |
Taille maximale du cache de la file d'attente des tâches dans le graphe de flux du nœud de requête. |
16 |
Description |
Valeur par défaut |
Nombre maximal de tâches exécutées en parallèle dans le graphe de flux |
1024 |
Description de la valeur par défaut |
Valeur par défaut |
Utiliser les statistiques de partition pour élaguer les données dans la recherche/requête sur le délégateur de tessons |
faux |
Description de la valeur par défaut |
Valeur par défaut |
renvoie la taille minimale du lot de la requête de flux |
4194304 |
Description de la valeur par défaut |
Valeur par défaut |
renvoie la taille maximale du lot de la requête de flux |
134217728 |
Description de la valeur par défaut |
Valeur par défaut |
facteur parallèle lors de l'application de pk au filtre bloom, par défaut 4*CPU_CORE_NUM |
4 |
Description de la valeur par défaut |
Valeur par défaut |
la taille du pool de clients du querynode travailleur |
10 |
Description de la valeur par défaut |
Valeur par défaut |
Adresse TCP/IP du queryNode. Si elle n'est pas spécifiée, la première adresse non diffusable est utilisée. |
|
Description |
Valeur par défaut |
Port TCP du nœud de requête |
21123 |
Description de la valeur par défaut |
Valeur par défaut |
Taille maximale de chaque requête RPC que le queryNode peut envoyer, unité : octet |
536870912 |
Description de la valeur par défaut |
Valeur par défaut |
La taille maximale de chaque requête RPC que le queryNode peut recevoir, unité : octet |
268435456 |
Description de la valeur par défaut |
Valeur par défaut |
La taille maximale de chaque requête RPC que les clients du queryNode peuvent envoyer, unité : byte |
268435456 |
Description de la valeur par défaut |
Valeur par défaut |
Taille maximale de chaque requête RPC que les clients du queryNode peuvent recevoir, unité : octet |
536870912 |