milvus-logo
LFAI
Home
  • Leitfaden für die Verwaltung

quotaAndLimits-bezogene Konfigurationen

QuotaConfig, Konfigurationen von Milvus Quota und Limits.

Standardmäßig aktivieren wir:

  1. TT-Schutz;

  2. Speicherschutz.

  3. Festplatten-Quotenschutz.

Sie können aktivieren:

  1. Begrenzung des DML-Durchsatzes;

  2. DDL, DQL qps/rps Begrenzung;

  3. DQL-Warteschlangenlänge/Latenzschutz;

  4. Schutz der DQL-Ergebnisrate;

Falls erforderlich, können Sie auch manuell erzwingen, dass RW-Anforderungen abgelehnt werden.

quotaAndLimits.enabled

Beschreibung Standardwert
`true` zum Aktivieren von Quoten und Grenzen, `false` zum Deaktivieren. true

quotaAndLimits.quotaCenterCollectInterval

Beschreibung Standardwert
  • quotaCenterCollectInterval ist das Zeitintervall, in dem quotaCenter
  • Metriken von Proxies, Abfragecluster und Datencluster sammelt.
  • Sekunden, (0 ~ 65536)
  • 3

    quotaAndLimits.limits.allocRetryTimes

    Beschreibung Standardwert
    Wiederholungszeiten bei fehlgeschlagenen Löschzuweisungen für Daten aus dem Ratenlimit 15

    quotaAndLimits.limits.allocWaitInterval

    Beschreibung Standardwert
    Wartezeit für Wiederholungsversuche bei fehlgeschlagenem Löschen von Vorwärtsdaten, in Millisekunden 1000

    quotaAndLimits.limits.complexDeleteLimitEnable

    Beschreibung Standardwert
    ob komplexe Löschprüfung von Vorwärtsdaten durch Begrenzer falsch

    quotaAndLimits.limits.maxCollectionNumPerDB

    Beschreibung Standardwert
    Maximale Anzahl von Sammlungen pro Datenbank. 65536

    quotaAndLimits.limits.maxInsertSize

    Beschreibung Standardwert
    maximale Größe einer einzelnen Einfügeanforderung, in Bytes, -1 bedeutet keine Begrenzung -1

    quotaAndLimits.limits.maxResourceGroupNumOfQueryNode

    Beschreibung Standardwert
    maximale Anzahl von Ressourcengruppen von Abfrageknoten 1024

    quotaAndLimits.ddl.enabled

    Beschreibung Standardwert
    Ob die DDL-Anforderungsdrosselung aktiviert ist. false

    quotaAndLimits.ddl.collectionRate

    Beschreibung Standardwert
  • Maximale Anzahl von sammlungsbezogenen DDL-Anforderungen pro Sekunde.
  • Wenn Sie dieses Element auf 10 setzen, bedeutet dies, dass Milvus nicht mehr als 10 sammlungsbezogene DDL-Anforderungen pro Sekunde verarbeitet, einschließlich Anforderungen zur Erstellung von Sammlungen, Anforderungen zum Löschen von Sammlungen, Anforderungen zum Laden von Sammlungen und Anforderungen zur Freigabe von Sammlungen.
  • Um diese Einstellung zu verwenden, setzen Sie gleichzeitig quotaAndLimits.ddl.enabled auf true.
  • -1

    quotaAndLimits.ddl.partitionRate

    Beschreibung Standardwert
  • Maximale Anzahl der partitionbezogenen DDL-Anforderungen pro Sekunde.
  • Die Einstellung 10 bedeutet, dass Milvus nicht mehr als 10 partitionsbezogene Anfragen pro Sekunde verarbeitet, einschließlich Anfragen zur Erstellung von Partitionen, Anfragen zum Löschen von Partitionen, Anfragen zum Laden von Partitionen und Anfragen zur Freigabe von Partitionen.
  • Um diese Einstellung zu verwenden, setzen Sie gleichzeitig quotaAndLimits.ddl.enabled auf true.
  • -1

    quotaAndLimits.ddl.db.collectionRate

    Beschreibung Standardwert
    qps der db-Ebene, standardmäßig kein Limit, Rate für CreateCollection, DropCollection, LoadCollection, ReleaseCollection -1

    quotaAndLimits.ddl.db.partitionRate

    Beschreibung Standardwert
    qps von db level, standardmäßig kein Limit, Rate für CreatePartition, DropPartition, LoadPartition, ReleasePartition -1

    quotaAndLimits.indexRate.enabled

    Beschreibung Voreinstellung Wert
    Ob indexbezogene Anforderungsdrosselung aktiviert ist. false

    quotaAndLimits.indexRate.max

    Beschreibung Standardwert
  • Maximale Anzahl von indexbezogenen Anfragen pro Sekunde.
  • Wenn dieser Wert auf 10 gesetzt wird, verarbeitet Milvus nicht mehr als 10 Partitionsanfragen pro Sekunde, einschließlich Indexerstellungsanfragen und Anfragen zum Löschen von Indizes.
  • Um diese Einstellung zu verwenden, setzen Sie gleichzeitig quotaAndLimits.indexRate.enabled auf true.
  • -1

    quotaAndLimits.indexRate.db.max

    Beschreibung Standardwert
    qps der db-Ebene, standardmäßig kein Limit, Rate für CreateIndex, DropIndex -1

    quotaAndLimits.flushRate.enabled

    Beschreibung Standardwert
    Ob die Drosselung von Flush-Anfragen aktiviert ist. true

    quotaAndLimits.flushRate.max

    Beschreibung Standardwert
  • Maximale Anzahl von Flush-Anforderungen pro Sekunde.
  • Die Einstellung 10 bedeutet, dass Milvus nicht mehr als 10 Flush-Anfragen pro Sekunde verarbeitet.
  • Um diese Einstellung zu verwenden, setzen Sie gleichzeitig quotaAndLimits.flushRate.enabled auf true.
  • -1

    quotaAndLimits.flushRate.collection.max

    Beschreibung Standardwert
    qps, standardmäßig kein Limit, Rate für Flush auf Sammlungsebene. 0.1

    quotaAndLimits.flushRate.db.max

    Beschreibung Standardwert
    qps der db-Ebene, standardmäßig keine Begrenzung, Rate für Flush -1

    quotaAndLimits.compactionRate.enabled

    Beschreibung Standardwert
    Ob die manuelle Drosselung von Verdichtungsanfragen aktiviert ist. false

    quotaAndLimits.compactionRate.max

    Beschreibung Standardwert
  • Maximale Anzahl der manuellen Verdichtungsanfragen pro Sekunde.
  • Die Einstellung 10 bedeutet, dass Milvus nicht mehr als 10 manuelle Verdichtungsanfragen pro Sekunde verarbeitet.
  • Um diese Einstellung zu verwenden, setzen Sie gleichzeitig quotaAndLimits.compaction.enabled auf true.
  • -1

    quotaAndLimits.compactionRate.db.max

    Beschreibung Standardwert
    qps von db level, standardmäßig kein Limit, Rate für manualCompaction -1

    quotaAndLimits.dml.enabled

    Beschreibung Standardwert
    Ob die Drosselung von DML-Anfragen aktiviert ist. false

    quotaAndLimits.dml.insertRate.max

    Beschreibung Standardwert
  • Höchste Dateneinfügerate pro Sekunde.
  • Wenn Sie diesen Wert auf 5 setzen, bedeutet dies, dass Milvus nur eine Dateneinfügung mit einer Rate von 5 MB/s zulässt.
  • Um diese Einstellung zu verwenden, setzen Sie gleichzeitig quotaAndLimits.dml.enabled auf true.
  • -1

    quotaAndLimits.dml.insertRate.db.max

    Beschreibung Standardwert
    MB/s, standardmäßig keine Begrenzung -1

    quotaAndLimits.dml.insertRate.collection.max

    Beschreibung Standardwert
  • Höchste Dateneinfügerate pro Sammlung und Sekunde.
  • Wenn dieser Wert auf 5 gesetzt wird, bedeutet dies, dass Milvus nur Daten mit einer Rate von 5 MB/s in eine Sammlung einfügen kann.
  • Um diese Einstellung zu verwenden, setzen Sie gleichzeitig quotaAndLimits.dml.enabled auf true.
  • -1

    quotaAndLimits.dml.insertRate.partition.max

    Beschreibung Standardwert
    MB/s, standardmäßig keine Begrenzung -1

    quotaAndLimits.dml.upsertRate.max

    Beschreibung Standardwert
    MB/s, standardmäßig kein Limit -1

    quotaAndLimits.dml.upsertRate.db.max

    Beschreibung Standardwert
    MB/s, standardmäßig kein Limit -1

    quotaAndLimits.dml.upsertRate.collection.max

    Beschreibung Standardwert
    MB/s, standardmäßig kein Limit -1

    quotaAndLimits.dml.upsertRate.partition.max

    Beschreibung Standardwert
    MB/s, standardmäßig kein Limit -1

    quotaAndLimits.dml.deleteRate.max

    Beschreibung Standardwert
  • Höchste Datenlöschrate pro Sekunde.
  • Wenn Sie diesen Wert auf 0,1 setzen, bedeutet dies, dass Milvus nur Datenlöschungen mit einer Geschwindigkeit von 0,1 MB/s zulässt.
  • Um diese Einstellung zu verwenden, setzen Sie gleichzeitig quotaAndLimits.dml.enabled auf true.
  • -1

    quotaAndLimits.dml.deleteRate.db.max

    Beschreibung Standardwert
    MB/s, standardmäßig keine Begrenzung -1

    quotaAndLimits.dml.deleteRate.collection.max

    Beschreibung Standardwert
  • Höchste Datenlöschrate pro Sekunde.
  • Die Einstellung 0,1 bedeutet, dass Milvus das Löschen von Daten aus einer Sammlung nur mit einer Rate von 0,1 MB/s erlaubt.
  • Um diese Einstellung zu verwenden, setzen Sie gleichzeitig quotaAndLimits.dml.enabled auf true.
  • -1

    quotaAndLimits.dml.deleteRate.partition.max

    Beschreibung Standardwert
    MB/s, standardmäßig keine Begrenzung -1

    quotaAndLimits.dml.bulkLoadRate.max

    Beschreibung Standardwert
    MB/s, standardmäßig kein Limit, wird noch nicht unterstützt. TODO: Begrenzung der BulkLoad-Rate -1

    quotaAndLimits.dml.bulkLoadRate.db.max

    Beschreibung Standardwert
    MB/s, standardmäßig keine Begrenzung, wird noch nicht unterstützt. TODO: db bulkLoad rate begrenzen -1

    quotaAndLimits.dml.bulkLoadRate.collection.max

    Beschreibung Standardwert
    MB/s, standardmäßig keine Begrenzung, wird noch nicht unterstützt. TODO: limit collection bulkLoad rate -1

    quotaAndLimits.dml.bulkLoadRate.partition.max

    Beschreibung Standardwert
    MB/s, standardmäßig keine Begrenzung, wird noch nicht unterstützt. TODO: Partition bulkLoad rate begrenzen -1

    quotaAndLimits.dql.enabled

    Beschreibung Standardwert
    Ob die DQL-Anforderungsdrosselung aktiviert ist. false

    quotaAndLimits.dql.searchRate.max

    Beschreibung Standardwert
  • Maximale Anzahl der zu durchsuchenden Vektoren pro Sekunde.
  • Der Wert 100 bedeutet, dass Milvus nur 100 Vektoren pro Sekunde durchsuchen darf, unabhängig davon, ob diese 100 Vektoren in einer einzigen Suche oder über mehrere Suchen verteilt sind.
  • Um diese Einstellung zu verwenden, setzen Sie gleichzeitig quotaAndLimits.dql.enabled auf true.
  • -1

    quotaAndLimits.dql.searchRate.db.max

    Beschreibung Standardwert
    vps (Vektoren pro Sekunde), standardmäßig keine Begrenzung -1

    quotaAndLimits.dql.searchRate.collection.max

    Beschreibung Standardwert
  • Maximale Anzahl der zu durchsuchenden Vektoren pro Sammlung und Sekunde.
  • Wenn dieser Wert auf 100 gesetzt wird, erlaubt Milvus nur die Suche nach 100 Vektoren pro Sekunde und Sammlung, unabhängig davon, ob diese 100 Vektoren alle in einer Suche oder über mehrere Suchen verteilt sind.
  • Um diese Einstellung zu verwenden, setzen Sie gleichzeitig quotaAndLimits.dql.enabled auf true.
  • -1

    quotaAndLimits.dql.searchRate.partition.max

    Beschreibung Standardwert
    vps (Vektoren pro Sekunde), standardmäßig keine Begrenzung -1

    quotaAndLimits.dql.queryRate.max

    Beschreibung Standardwert
  • Maximale Anzahl von Abfragen pro Sekunde.
  • Die Einstellung 100 bedeutet, dass Milvus nur 100 Abfragen pro Sekunde zulässt.
  • Um diese Einstellung zu verwenden, setzen Sie gleichzeitig quotaAndLimits.dql.enabled auf true.
  • -1

    quotaAndLimits.dql.queryRate.db.max

    Beschreibung Standardwert
    qps, standardmäßig keine Begrenzung -1

    quotaAndLimits.dql.queryRate.collection.max

    Beschreibung Standardwert
  • Maximale Anzahl von Abfragen pro Sammlung und Sekunde.
  • Die Einstellung 100 bedeutet, dass Milvus nur 100 Abfragen pro Sammlung pro Sekunde zulässt.
  • Um diese Einstellung zu verwenden, setzen Sie gleichzeitig quotaAndLimits.dql.enabled auf true.
  • -1

    quotaAndLimits.dql.queryRate.partition.max

    Beschreibung Standardwert
    qps, standardmäßig keine Begrenzung -1

    quotaAndLimits.limitWriting.forceDeny

    Beschreibung Standardwert
  • forceDeny false bedeutet, dass dml-Anfragen erlaubt sind (außer bei einigen
  • bestimmten Bedingungen, wie z.B. Speicher der Knoten zur Wassermarkierung), true bedeutet, dass alle dml-Anfragen immer abgelehnt werden.
  • false

    quotaAndLimits.limitWriting.ttProtection.maxTimeTickDelay

    Beschreibung Standardwert
  • maxTimeTickDelay gibt den Gegendruck für DML-Operationen an.
  • Die DML-Raten werden entsprechend dem Verhältnis von time tick delay zu maxTimeTickDelay reduziert,
  • Wenn die Zeitverzögerung größer als maxTimeTickDelay ist, werden alle DML-Anforderungen zurückgewiesen.
  • Sekunden
  • 300

    quotaAndLimits.limitWriting.memProtection.enabled

    Beschreibung Standardwert
  • Wenn Speichernutzung > memoryHighWaterLevel, werden alle DML-Anforderungen abgelehnt;
  • Wenn memoryLowWaterLevel < memory usage < memoryHighWaterLevel, wird die dml-Rate reduziert;
  • Wenn Speichernutzung < memoryLowWaterLevel, keine Aktion.
  • true

    quotaAndLimits.limitWriting.memProtection.dataNodeMemoryLowWaterLevel

    Beschreibung Standardwert
    (0, 1], memoryLowWaterLevel in DataNodes 0.85

    quotaAndLimits.limitWriting.memProtection.dataNodeMemoryHighWaterLevel

    Beschreibung Standardwert
    (0, 1], SpeicherHochWasserstand in Datenknoten 0.95

    quotaAndLimits.limitWriting.memProtection.queryNodeMemoryLowWaterLevel

    Beschreibung Standardwert
    (0, 1], memoryLowWaterLevel in QueryNodes 0.85

    quotaAndLimits.limitWriting.memProtection.queryNodeMemoryHighWaterLevel

    Beschreibung Standardwert
    (0, 1], memoryHighWaterLevel in QueryNodes 0.95

    quotaAndLimits.limitWriting.growingSegmentsSizeProtection.enabled

    Beschreibung Standardwert
  • Es werden keine Maßnahmen ergriffen, wenn die Größe der wachsenden Segmente kleiner als die niedrige Wasserstandsmarke ist.
  • Wenn die Größe der wachsenden Segmente das niedrige Wasserzeichen überschreitet, wird die dml-Rate reduziert,
  • aber die Rate wird nicht niedriger als minRateRatio * dmlRate sein.
  • false

    quotaAndLimits.limitWriting.diskProtection.enabled

    Beschreibung Standardwert
    Wenn die gesamte Dateigröße des Objektspeichers größer ist als `diskQuota`, werden alle dml-Anfragen abgelehnt; true

    quotaAndLimits.limitWriting.diskProtection.diskQuota

    Beschreibung Standardwert
    MB, (0, +inf), standardmäßig kein Limit -1

    quotaAndLimits.limitWriting.diskProtection.diskQuotaPerDB

    Beschreibung Standardwert
    MB, (0, +inf), Voreinstellung kein Limit -1

    quotaAndLimits.limitWriting.diskProtection.diskQuotaPerCollection

    Beschreibung Standardwert
    MB, (0, +inf), Voreinstellung kein Limit -1

    quotaAndLimits.limitWriting.diskProtection.diskQuotaPerPartition

    Beschreibung Standardwert
    MB, (0, +inf), Voreinstellung kein Limit -1

    quotaAndLimits.limitWriting.l0SegmentsRowCountProtection.enabled

    Beschreibung Standardwert
    Schalter zum Aktivieren der L0-Segment-Zeilenanzahl-Quote falsch

    quotaAndLimits.limitWriting.l0SegmentsRowCountProtection.lowWaterLevel

    Beschreibung Standardwert
    l0 segment row count quota, Niedrigwasserstand 32768

    quotaAndLimits.limitWriting.l0SegmentsRowCountProtection.highWaterLevel

    Beschreibung Standardwert
    l0 segment row count quota, niedriger Wasserstand 65536

    quotaAndLimits.limitReading.forceDeny

    Beschreibung Standardwert
  • forceDeny false bedeutet, dass dql-Anfragen erlaubt sind (außer bei einigen
  • bestimmten Bedingungen, wie z.B. Sammlung wurde fallen gelassen), true bedeutet, dass alle dql-Anfragen immer abgelehnt werden.
  • false

    quotaAndLimits.limitReading.queueProtection.nqInQueueThreshold

    Beschreibung Standardwert
  • nqInQueueThreshold zeigt an, dass das System unter Gegendruck für den Such-/Abfragepfad steht.
  • Wenn die NQ in der Warteschlange eines QueryNode größer als nqInQueueThreshold ist, würden die Such- und Abfrageraten allmählich abkühlen
  • bis die NQ in der Warteschlange nicht mehr über nqInQueueThreshold liegt. Wir stellen uns die NQ der Suchanfragen als 1 vor.
  • int, standardmäßig keine Begrenzung
  • -1

    quotaAndLimits.limitReading.queueProtection.queueLatencyThreshold

    Beschreibung Standardwert
  • queueLatencyThreshold zeigt an, dass das System unter Gegendruck für den Search/Query-Pfad steht.
  • Wenn die dql-Latenz der Warteschlange größer als queueLatencyThreshold ist, würden die Such- und Abfrageraten allmählich abkühlen
  • bis die Latenzzeit der Warteschlangen nicht mehr über dem queueLatencyThreshold liegt.
  • Die Latenz bezieht sich hier auf die über einen bestimmten Zeitraum gemittelte Latenz.
  • Millisekunden, standardmäßig keine Begrenzung
  • -1

    quotaAndLimits.limitReading.resultProtection.maxReadResultRate

    Beschreibung Standardwert
  • maxReadResultRate zeigt an, dass das System unter Gegendruck für den Such-/Abfragepfad steht.
  • Wenn die dql-Ergebnisrate größer als maxReadResultRate ist, würde die Such-/Abfragerate allmählich abkühlen
  • bis die Lese-Ergebnisrate nicht mehr über maxReadResultRate liegt.
  • MB/s, standardmäßig keine Begrenzung
  • -1

    quotaAndLimits.limitReading.coolOffSpeed

    Beschreibung Standardwert
  • colOffSpeed ist die Geschwindigkeit, mit der die Such- und Abfrageraten abkühlen.
  • (0, 1]
  • 0.9

    Übersetzt vonDeepLogo

    Tabelle der Inhalte
    Feedback

    War diese Seite hilfreich?