Configuration connexe de queryNode, utilisée pour effectuer une recherche hybride entre des données vectorielles et scalaires.
Description de la configuration |
Valeur par défaut |
Intervalle pendant lequel le nœud de requête publie les informations statistiques du nœud, y compris l'état du segment, l'utilisation du processeur, l'utilisation de la mémoire, l'état de santé, etc. Unité : ms. |
1000 |
Description |
Valeur par défaut |
Le nombre de threads dans le pool de threads de knowhere. Si le disque est activé, la taille du pool sera multipliée par knowhereThreadPoolNumRatio([1, 32]). |
4 |
Description |
Valeur par défaut |
Nombre de lignes par lequel Segcore divise un segment en morceaux. |
128 |
Description de la valeur par défaut |
Valeur par défaut |
Création ou non d'un index temporaire pour les segments en croissance et les segments scellés non encore indexés, afin d'améliorer les performances de recherche.
Milvus finira par sceller et indexer tous les segments, mais l'activation de cette option optimise les performances de recherche pour les requêtes immédiates après l'insertion des données.
La valeur par défaut est true, ce qui indique que Milvus crée un index temporaire pour les segments en croissance et les segments scellés qui ne sont pas indexés lors des recherches. |
vrai |
Description |
Valeur par défaut |
index temporaire nlist, il est recommandé de définir sqrt(chunkRows), doit être inférieur à chunkRows/8 |
128 |
Description |
Valeur par défaut |
nprobe pour rechercher un petit index, basé sur votre exigence de précision, doit être inférieur à nlist |
16 |
Description de la valeur par défaut |
Valeur par défaut |
mémoire supplémentaire nécessaire à la construction de l'index provisoire |
1.15 |
Description de la valeur par défaut |
Valeur par défaut |
le rapport entre la construction de l'index intermédiaire en parallèle et le nombre de processeurs |
0.5 |
Description de la valeur par défaut |
Valeur par défaut |
Activer la logique de calcul du score de cohérence forte de Knowhere |
faux |
Description |
Valeur par défaut |
Le facteur de multiplication du calcul de l'utilisation de la mémoire lors du chargement des segments |
1 |
Description de la valeur par défaut |
Valeur par défaut |
permet au querynode de charger l'index du disque et d'effectuer une recherche sur l'index du disque |
faux |
Description |
Valeur par défaut |
2 GB, 2 * 1024 *1024 *1024 |
2147483648 |
Description de la valeur par défaut |
Valeur par défaut |
La politique de lecture anticipée du cache de morceaux, options : `normal, random, sequential, willneed, dontneed` |
willneed |
Description |
Valeur par défaut |
options : async, sync, disable.
Spécifie la nécessité de réchauffer le cache de morceaux.
1. Si la valeur est "sync" ou "async", les données vectorielles originales seront chargées de manière synchrone/asynchrone dans la mémoire cache pendant le chargement.
dans le chunk cache pendant le processus de chargement. Cette approche permet de réduire considérablement la latence des requêtes et des recherches pendant une durée déterminée après le chargement.
pendant une durée spécifique après le chargement, bien qu'elle s'accompagne d'une augmentation concomitante de l'utilisation du disque ;
2. Si l'option "disable" est choisie, les données vectorielles originales ne seront chargées dans la mémoire cache que pendant la recherche. |
désactiver |
Description |
Valeur par défaut |
Active la mémoire tampon pour le chargement des données |
false (faux) |
Description |
Valeur par défaut |
Activer la mémoire tampon pour l'utilisation des données brutes en cours de croissance |
false |
Description de la valeur par défaut |
Valeur par défaut |
Activer le lazyload pour le chargement des données |
faux |
Description de la valeur par défaut |
Valeur par défaut |
délai d'attente maximal durée en millisecondes avant le début de la recherche et de l'extraction par lazyload |
30000 |
Description de la valeur par défaut |
Valeur par défaut |
délai maximum en millisecondes pour l'attente d'une ressource pour la charge paresseuse, 5s par défaut |
5000 |
Description de la valeur par défaut |
Valeur par défaut |
intervalle de réessai en millisecondes pour l'attente d'une demande de ressource pour une charge paresseuse, 2s par défaut |
2000 |
Description de la valeur par défaut |
Valeur par défaut |
Nombre maximal de tentatives pour la charge paresseuse, 1 par défaut |
1 |
Description de la valeur par défaut |
Valeur par défaut |
max evict count for lazy load, 1 par défaut |
1 |
Description de la valeur par défaut |
Valeur par défaut |
maxReadConcurrentRatio est le taux de simultanéité de la tâche de lecture (tâche de recherche et tâche de requête).
La simultanéité de lecture maximale correspond à la valeur de hardware.GetCPUNum * maxReadConcurrentRatio.
La valeur par défaut est 2.0, ce qui signifie que la simultanéité de lecture maximale est égale à la valeur de hardware.GetCPUNum * 2.
La simultanéité de lecture maximale doit être supérieure ou égale à 1, et inférieure ou égale à hardware.GetCPUNum * 100.
(0, 100] |
1 |
Description de la valeur par défaut |
Valeur par défaut |
ratio utilisé pour estimer l'utilisation du processeur de la tâche de lecture. |
10 |
Description de la valeur par défaut |
Valeur par défaut |
fifo : Une file d'attente FIFO prend en charge la planification.
user-task-polling :
Les tâches de l'utilisateur sont interrogées une par une et programmées.
L'ordonnancement est équitable en fonction de la granularité des tâches.
La politique est basée sur le nom d'utilisateur pour l'authentification.
Un nom d'utilisateur vide est considéré comme le même utilisateur.
Lorsqu'il n'y a pas de multi-utilisateurs, la politique se décompose en FIFO" |
fifo |
Description |
Valeur par défaut |
Contrôle la durée (en nombre de secondes) pendant laquelle la file d'attente est conservée lorsqu'elle est vide. |
60 |
Description |
Valeur par défaut |
Active le regroupement d'utilisateurs croisés lors de l'utilisation de la politique de sondage des tâches des utilisateurs. (Désactiver si les tâches de l'utilisateur ne peuvent pas être fusionnées) |
faux |
Description |
Valeur par défaut |
Tâche maximale en attente par utilisateur dans l'ordonnanceur |
1024 |
Description de la valeur par défaut |
Valeur par défaut |
Taille maximale du cache de la file d'attente des tâches dans le graphe de flux du nœud de requête. |
16 |
Description |
Valeur par défaut |
Nombre maximal de tâches exécutées en parallèle dans le graphe de flux |
1024 |
Description de la valeur par défaut |
Valeur par défaut |
Utiliser les statistiques de partition pour élaguer les données dans la recherche/requête sur le délégateur de tessons |
faux |
Description de la valeur par défaut |
Valeur par défaut |
facteur parallèle lors de l'application du pk au filtre bloom, par défaut 4*CPU_CORE_NUM |
4 |
Description de la valeur par défaut |
Valeur par défaut |
taille du lot de retour de la requête de flux |
4194304 |
Description de la valeur par défaut |
Valeur par défaut |
la taille du pool de clients du nœud de requête du travailleur |
10 |
Description de la valeur par défaut |
Valeur par défaut |
Adresse TCP/IP du queryNode. Si elle n'est pas spécifiée, la première adresse non diffusable est utilisée. |
|
Description |
Valeur par défaut |
Port TCP du nœud de requête |
21123 |
Description de la valeur par défaut |
Valeur par défaut |
Taille maximale de chaque requête RPC que le queryNode peut envoyer, unité : octet |
536870912 |
Description de la valeur par défaut |
Valeur par défaut |
La taille maximale de chaque requête RPC que le queryNode peut recevoir, unité : octet |
268435456 |
Description de la valeur par défaut |
Valeur par défaut |
La taille maximale de chaque requête RPC que les clients du queryNode peuvent envoyer, unité : byte |
268435456 |
Description de la valeur par défaut |
Valeur par défaut |
Taille maximale de chaque requête RPC que les clients du queryNode peuvent recevoir, unité : octet |
536870912 |