nombre maximal de groupes de ressources de nœuds d'interrogation
1024
quotaAndLimits.ddl.enabled
Description
Valeur par défaut
Si la limitation des requêtes DDL est activée.
faux
quotaAndLimits.ddl.collectionRate
Description de la valeur par défaut
Valeur par défaut
Nombre maximum de requêtes DDL liées aux collections par seconde.
La valeur 10 attribuée à cet élément indique que Milvus ne traite pas plus de 10 demandes DDL liées aux collections par seconde, y compris les demandes de création de collection, les demandes d'abandon de collection, les demandes de chargement de collection et les demandes de libération de collection.
Pour utiliser ce paramètre, définissez en même temps quotaAndLimits.ddl.enabled sur true.
-1
quotaAndLimits.ddl.partitionRate
Description
Valeur par défaut
Nombre maximal de requêtes DDL liées à la partition par seconde.
La définition de cet élément sur 10 indique que Milvus ne traite pas plus de 10 demandes liées à la partition par seconde, y compris les demandes de création de partition, les demandes d'abandon de partition, les demandes de chargement de partition et les demandes de libération de partition.
Pour utiliser ce paramètre, définissez en même temps quotaAndLimits.ddl.enabled sur true.
-1
quotaAndLimits.ddl.db.collectionRate
Description
Valeur par défaut
qps du niveau de la base de données, pas de limite par défaut, taux pour CreateCollection, DropCollection, LoadCollection, ReleaseCollection
-1
quotaAndLimits.ddl.db.partitionRate
Description de la valeur par défaut
Valeur par défaut
qps du niveau de la base de données, pas de limite par défaut, taux pour CreatePartition, DropPartition, LoadPartition, ReleasePartition
-1
quotaAndLimits.indexRate.enabled
Description de la valeur par défaut
Valeur par défaut
Indique si la limitation des requêtes liées à l'index est activée.
faux
quotaAndLimits.indexRate.max
Description de la valeur par défaut
Valeur par défaut
Nombre maximum de requêtes liées à l'index par seconde.
La définition de cet élément sur 10 indique que Milvus ne traite pas plus de 10 demandes liées à la partition par seconde, y compris les demandes de création et d'abandon d'index.
Pour utiliser ce paramètre, définissez en même temps quotaAndLimits.indexRate.enabled sur true.
-1
quotaAndLimits.indexRate.db.max
Description
Valeur par défaut
qps du niveau de la base de données, pas de limite par défaut, taux pour CreateIndex, DropIndex
-1
quotaAndLimits.flushRate.enabled
Description de la valeur par défaut
Valeur par défaut
Indique si la limitation des demandes de vidange est activée.
vrai
quotaAndLimits.flushRate.max
Description
Valeur par défaut
Nombre maximum de demandes de vidange par seconde.
La valeur 10 indique que Milvus ne traite pas plus de 10 demandes de vidange par seconde.
Pour utiliser ce paramètre, définissez en même temps quotaAndLimits.flushRate.enabled sur true.
-1
quotaAndLimits.flushRate.collection.max
Description
Valeur par défaut
qps, pas de limite par défaut, taux de vidange au niveau de la collection.
0.1
quotaAndLimits.flushRate.db.max
Description de la valeur par défaut
Valeur par défaut
qps au niveau de la base de données, pas de limite par défaut, taux de vidange
-1
quotaAndLimits.compactionRate.enabled
Description de la valeur par défaut
Valeur par défaut
Indique si la limitation manuelle des demandes de compactage est activée.
faux
quotaAndLimits.compactionRate.max
Description de la valeur par défaut
Valeur par défaut
Nombre maximum de demandes de compactage manuel par seconde.
La définition de cet élément sur 10 indique que Milvus ne traite pas plus de 10 demandes de compactage manuel par seconde.
Pour utiliser ce paramètre, définissez en même temps quotaAndLimits.compaction.enabled sur true.
-1
quotaAndLimits.compactionRate.db.max
Description
Valeur par défaut
qps du niveau db, pas de limite par défaut, taux de compactage manuel
-1
quotaAndLimits.dml.enabled
Description de la valeur par défaut
Valeur par défaut
Indique si la limitation des requêtes DML est activée.
faux
quotaAndLimits.dml.insertRate.max
Description de la valeur par défaut
Valeur par défaut
Taux d'insertion de données le plus élevé par seconde.
La définition de cet élément sur 5 indique que Milvus n'autorise que l'insertion de données au taux de 5 Mo/s.
Pour utiliser ce paramètre, définissez en même temps quotaAndLimits.dml.enabled sur true.
-1
quotaAndLimits.dml.insertRate.db.max
Description
Valeur par défaut
MB/s, pas de limite par défaut
-1
quotaAndLimits.dml.insertRate.collection.max
Description de la valeur par défaut
Valeur par défaut
Taux d'insertion de données le plus élevé par collection et par seconde.
La valeur 5 indique que Milvus n'autorise l'insertion de données dans une collection qu'à la vitesse de 5 Mo/s.
Pour utiliser ce paramètre, définissez en même temps quotaAndLimits.dml.enabled sur true.
-1
quotaAndLimits.dml.insertRate.partition.max
Description
Valeur par défaut
MB/s, pas de limite par défaut
-1
quotaAndLimits.dml.upsertRate.max
Description de la valeur par défaut
Valeur par défaut
MB/s, pas de limite par défaut
-1
quotaAndLimits.dml.upsertRate.db.max
Description de la valeur par défaut
Valeur par défaut
MB/s, pas de limite par défaut
-1
quotaAndLimits.dml.upsertRate.collection.max
Description de la valeur par défaut
Valeur par défaut
MB/s, pas de limite par défaut
-1
quotaAndLimits.dml.upsertRate.partition.max
Description de la valeur par défaut
Valeur par défaut
MB/s, pas de limite par défaut
-1
quotaAndLimits.dml.deleteRate.max
Description de la valeur par défaut
Valeur par défaut
Taux de suppression de données le plus élevé par seconde.
La définition de cet élément sur 0,1 indique que Milvus n'autorise que la suppression de données au taux de 0,1 Mo/s.
Pour utiliser ce paramètre, définissez en même temps quotaAndLimits.dml.enabled sur true.
-1
quotaAndLimits.dml.deleteRate.db.max
Description
Valeur par défaut
MB/s, pas de limite par défaut
-1
quotaAndLimits.dml.deleteRate.collection.max
Description de la valeur par défaut
Valeur par défaut
Taux de suppression de données le plus élevé par seconde.
La définition de cet élément sur 0,1 indique que Milvus n'autorise la suppression de données d'une collection qu'à un taux de 0,1 Mo/s.
Pour utiliser ce paramètre, définissez en même temps quotaAndLimits.dml.enabled sur true.
-1
quotaAndLimits.dml.deleteRate.partition.max
Description
Valeur par défaut
MB/s, pas de limite par défaut
-1
quotaAndLimits.dml.bulkLoadRate.max
Description de la valeur par défaut
Valeur par défaut
MB/s, pas de limite par défaut, pas encore supporté. TODO : limiter le taux de bulkLoad
-1
quotaAndLimits.dml.bulkLoadRate.db.max
Description
Valeur par défaut
MB/s, pas de limite par défaut, pas de support pour l'instant. TODO : limit db bulkLoad rate
-1
quotaAndLimits.dml.bulkLoadRate.collection.max
Description
Valeur par défaut
MB/s, pas de limite par défaut, pas de support pour l'instant. TODO : limiter le taux de chargement de la collection
-1
quotaAndLimits.dml.bulkLoadRate.partition.max
Description
Valeur par défaut
MB/s, pas de limite par défaut, pas de support pour l'instant. TODO : limiter le taux de chargement en masse des partitions
-1
quotaAndLimits.dql.enabled
Description
Valeur par défaut
Indique si la limitation des requêtes DQL est activée.
faux
quotaAndLimits.dql.searchRate.max
Description de la valeur par défaut
Valeur par défaut
Nombre maximum de vecteurs à rechercher par seconde.
La valeur 100 indique que Milvus n'autorise que la recherche de 100 vecteurs par seconde, que ces 100 vecteurs soient tous regroupés dans une seule recherche ou dispersés dans plusieurs recherches.
Pour utiliser ce paramètre, définissez en même temps quotaAndLimits.dql.enabled sur true.
-1
quotaAndLimits.dql.searchRate.db.max
Description
Valeur par défaut
vps (vecteurs par seconde), pas de limite par défaut
-1
quotaAndLimits.dql.searchRate.collection.max
Description de la valeur par défaut
Valeur par défaut
Nombre maximum de vecteurs à rechercher par collection et par seconde.
La valeur 100 indique que Milvus n'autorise que la recherche de 100 vecteurs par seconde et par collection, que ces 100 vecteurs soient regroupés dans une seule recherche ou dispersés dans plusieurs recherches.
Pour utiliser ce paramètre, définissez en même temps quotaAndLimits.dql.enabled sur true.
-1
quotaAndLimits.dql.searchRate.partition.max
Description
Valeur par défaut
vps (vecteurs par seconde), pas de limite par défaut
-1
quotaAndLimits.dql.queryRate.max
Description de la valeur par défaut
Valeur par défaut
Nombre maximum de requêtes par seconde.
La valeur 100 indique que Milvus n'autorise que 100 requêtes par seconde.
Pour utiliser ce paramètre, définissez en même temps quotaAndLimits.dql.enabled sur true.
-1
quotaAndLimits.dql.queryRate.db.max
Description
Valeur par défaut
qps, pas de limite par défaut
-1
quotaAndLimits.dql.queryRate.collection.max
Description de la valeur par défaut
Valeur par défaut
Nombre maximum de requêtes par collection et par seconde.
La valeur 100 indique que Milvus n'autorise que 100 requêtes par collection et par seconde.
Pour utiliser ce paramètre, définissez en même temps quotaAndLimits.dql.enabled sur true.
-1
quotaAndLimits.dql.queryRate.partition.max
Description
Valeur par défaut
qps, pas de limite par défaut
-1
quotaAndLimits.limitWriting.forceDeny
Description de la valeur par défaut
Valeur par défaut
forceDeny false signifie que les requêtes dml sont autorisées (sauf pour certaines
conditions spécifiques, telles que la mémoire des nœuds pour le marqueur d'eau), true signifie que toutes les demandes dml sont toujours rejetées.
nqInQueueThreshold indique que le système subit une contre-pression pour le chemin de recherche/requête.
Si le nombre de requêtes dans la file d'attente d'un QueryNode est supérieur au seuil nqInQueueThreshold, les taux de recherche et de requête diminuent progressivement.
jusqu'à ce que le NQ dans la file d'attente ne dépasse plus le seuil nqInQueueThreshold. Nous considérons que le NQ de la demande de requête est égal à 1.
queueLatencyThreshold indique que le système subit une contre-pression pour le chemin de recherche/requête.
Si la latence de la file d'attente est supérieure au seuil de latence de la file d'attente, les taux de recherche et de requête diminuent progressivement jusqu'à ce que la latence de la file d'attente ne dépasse plus le seuil de latence de la file d'attente.
jusqu'à ce que la latence de la file d'attente ne dépasse plus le seuil de latence de la file d'attente.
La latence se réfère ici à la latence moyenne sur une période de temps.
maxReadResultRate indique que le système subit une contre-pression pour le chemin de recherche/interrogation.
Si le taux de résultats dql est supérieur à maxReadResultRate, les taux de recherche et d'interrogation diminuent progressivement jusqu'à ce que le taux de résultats de lecture ne dépasse plus maxReadResultRate.
jusqu'à ce que le taux de résultat de lecture ne dépasse plus maxReadResultRate.
MB/s, pas de limite par défaut
-1
quotaAndLimits.limitReading.coolOffSpeed
Description de l'option
Valeur par défaut
colOffSpeed est la vitesse de refroidissement des taux de recherche et de requête.