Milvus
Zilliz
Home
  • Leitfaden für die Verwaltung

quotaAndLimits-bezogene Konfigurationen

QuotaConfig, Konfigurationen von Milvus Quota und Limits.

Standardmäßig aktivieren wir:

  1. TT-Schutz;

  2. Speicherschutz.

  3. Festplatten-Quotenschutz.

Sie können aktivieren:

  1. Begrenzung des DML-Durchsatzes;

  2. DDL, DQL qps/rps Begrenzung;

  3. DQL-Warteschlangenlänge/Latenzschutz;

  4. Schutz der DQL-Ergebnisrate;

Falls erforderlich, können Sie auch manuell erzwingen, dass RW-Anforderungen abgelehnt werden.

quotaAndLimits.enabled

Beschreibung Standardwert
`true` zum Aktivieren von Quoten und Grenzen, `false` zum Deaktivieren. true

quotaAndLimits.quotaCenterCollectInterval

Beschreibung Standardwert
  • quotaCenterCollectInterval ist das Zeitintervall, in dem quotaCenter
  • Metriken von Proxies, Abfragecluster und Datencluster sammelt.
  • Sekunden, (0 ~ 65536)
  • 3

    quotaAndLimits.limits.allocRetryTimes

    Beschreibung Standardwert
    Wiederholungszeiten bei fehlgeschlagenen Löschzuweisungen für Daten aus dem Ratenlimit 15

    quotaAndLimits.limits.allocWaitInterval

    Beschreibung Standardwert
    Wartezeit für Wiederholungsversuche bei fehlgeschlagenem Löschen der Vorwärtsdaten, in Millisekunden 1000

    quotaAndLimits.limits.complexDeleteLimitEnable

    Beschreibung Standardwert
    ob komplexe Löschprüfung von Vorwärtsdaten durch Begrenzer falsch

    quotaAndLimits.limits.maxCollectionNumPerDB

    Beschreibung Standardwert
    Maximale Anzahl von Sammlungen pro Datenbank. 65536

    quotaAndLimits.limits.maxInsertSize

    Beschreibung Standardwert
    maximale Größe einer einzelnen Einfügeanforderung, in Bytes, -1 bedeutet keine Begrenzung -1

    quotaAndLimits.limits.maxResourceGroupNumOfQueryNode

    Beschreibung Standardwert
    maximale Anzahl von Ressourcengruppen von Abfrageknoten 1024

    quotaAndLimits.limits.maxGroupSize

    Beschreibung Standardwert
    maximale Größe für eine einzelne Gruppe bei der Suche gruppieren nach 10

    quotaAndLimits.ddl.enabled

    Beschreibung Standardwert
    Gibt an, ob die DDL-Anforderungsdrosselung aktiviert ist. false

    quotaAndLimits.ddl.collectionRate

    Beschreibung Standardwert
  • Maximale Anzahl von sammlungsbezogenen DDL-Anforderungen pro Sekunde.
  • Wenn Sie dieses Element auf 10 setzen, bedeutet dies, dass Milvus nicht mehr als 10 sammlungsbezogene DDL-Anforderungen pro Sekunde verarbeitet, einschließlich Anforderungen zur Erstellung von Sammlungen, Anforderungen zum Löschen von Sammlungen, Anforderungen zum Laden von Sammlungen und Anforderungen zur Freigabe von Sammlungen.
  • Um diese Einstellung zu verwenden, setzen Sie gleichzeitig quotaAndLimits.ddl.enabled auf true.
  • -1

    quotaAndLimits.ddl.partitionRate

    Beschreibung Standardwert
  • Maximale Anzahl der partitionbezogenen DDL-Anforderungen pro Sekunde.
  • Die Einstellung 10 bedeutet, dass Milvus nicht mehr als 10 partitionsbezogene Anfragen pro Sekunde verarbeitet, einschließlich Anfragen zur Erstellung von Partitionen, Anfragen zum Löschen von Partitionen, Anfragen zum Laden von Partitionen und Anfragen zur Freigabe von Partitionen.
  • Um diese Einstellung zu verwenden, setzen Sie gleichzeitig quotaAndLimits.ddl.enabled auf true.
  • -1

    quotaAndLimits.ddl.db.collectionRate

    Beschreibung Standardwert
    qps der db-Ebene, standardmäßig kein Limit, Rate für CreateCollection, DropCollection, LoadCollection, ReleaseCollection -1

    quotaAndLimits.ddl.db.partitionRate

    Beschreibung Standardwert
    qps von db level, standardmäßig kein Limit, Rate für CreatePartition, DropPartition, LoadPartition, ReleasePartition -1

    quotaAndLimits.indexRate.enabled

    Beschreibung Voreinstellung Wert
    Ob indexbezogene Anforderungsdrosselung aktiviert ist. false

    quotaAndLimits.indexRate.max

    Beschreibung Standardwert
  • Maximale Anzahl von indexbezogenen Anfragen pro Sekunde.
  • Wenn dieser Wert auf 10 gesetzt wird, verarbeitet Milvus nicht mehr als 10 Partitionsanfragen pro Sekunde, einschließlich Indexerstellungsanfragen und Anfragen zum Löschen von Indizes.
  • Um diese Einstellung zu verwenden, setzen Sie gleichzeitig quotaAndLimits.indexRate.enabled auf true.
  • -1

    quotaAndLimits.indexRate.db.max

    Beschreibung Standardwert
    qps der db-Ebene, standardmäßig kein Limit, Rate für CreateIndex, DropIndex -1

    quotaAndLimits.flushRate.enabled

    Beschreibung Standardwert
    Ob die Drosselung von Flush-Anfragen aktiviert ist. true

    quotaAndLimits.flushRate.max

    Beschreibung Standardwert
  • Maximale Anzahl von Flush-Anforderungen pro Sekunde.
  • Die Einstellung 10 bedeutet, dass Milvus nicht mehr als 10 Flush-Anfragen pro Sekunde verarbeitet.
  • Um diese Einstellung zu verwenden, setzen Sie gleichzeitig quotaAndLimits.flushRate.enabled auf true.
  • -1

    quotaAndLimits.flushRate.collection.max

    Beschreibung Standardwert
    qps, standardmäßig kein Limit, Rate für Flush auf Sammlungsebene. 0.1

    quotaAndLimits.flushRate.db.max

    Beschreibung Standardwert
    qps der db-Ebene, standardmäßig keine Begrenzung, Rate für Flush -1

    quotaAndLimits.compactionRate.enabled

    Beschreibung Standardwert
    Gibt an, ob die manuelle Drosselung von Verdichtungsanfragen aktiviert ist. false

    quotaAndLimits.compactionRate.max

    Beschreibung Standardwert
  • Maximale Anzahl der manuellen Verdichtungsanfragen pro Sekunde.
  • Der Wert 10 bedeutet, dass Milvus nicht mehr als 10 manuelle Verdichtungsanfragen pro Sekunde verarbeitet.
  • Um diese Einstellung zu verwenden, setzen Sie gleichzeitig quotaAndLimits.compaction.enabled auf true.
  • -1

    quotaAndLimits.compactionRate.db.max

    Beschreibung Standardwert
    qps von db level, standardmäßig kein Limit, Rate für manualCompaction -1

    quotaAndLimits.dml.enabled

    Beschreibung Standardwert
    Ob die Drosselung von DML-Anfragen aktiviert ist. false

    quotaAndLimits.dml.insertRate.max

    Beschreibung Standardwert
  • Höchste Dateneinfügerate pro Sekunde.
  • Wenn Sie diesen Wert auf 5 setzen, bedeutet dies, dass Milvus nur eine Dateneinfügung mit einer Rate von 5 MB/s zulässt.
  • Um diese Einstellung zu verwenden, setzen Sie gleichzeitig quotaAndLimits.dml.enabled auf true.
  • -1

    quotaAndLimits.dml.insertRate.db.max

    Beschreibung Standardwert
    MB/s, standardmäßig keine Begrenzung -1

    quotaAndLimits.dml.insertRate.collection.max

    Beschreibung Standardwert
  • Höchste Dateneinfügerate pro Sammlung und Sekunde.
  • Wenn dieser Wert auf 5 gesetzt wird, bedeutet dies, dass Milvus nur Daten mit einer Rate von 5 MB/s in eine Sammlung einfügen kann.
  • Um diese Einstellung zu verwenden, setzen Sie gleichzeitig quotaAndLimits.dml.enabled auf true.
  • -1

    quotaAndLimits.dml.insertRate.partition.max

    Beschreibung Standardwert
    MB/s, standardmäßig keine Begrenzung -1

    quotaAndLimits.dml.upsertRate.max

    Beschreibung Standardwert
    MB/s, standardmäßig kein Limit -1

    quotaAndLimits.dml.upsertRate.db.max

    Beschreibung Standardwert
    MB/s, standardmäßig kein Limit -1

    quotaAndLimits.dml.upsertRate.collection.max

    Beschreibung Standardwert
    MB/s, standardmäßig kein Limit -1

    quotaAndLimits.dml.upsertRate.partition.max

    Beschreibung Standardwert
    MB/s, standardmäßig kein Limit -1

    quotaAndLimits.dml.deleteRate.max

    Beschreibung Standardwert
  • Höchste Datenlöschrate pro Sekunde.
  • Wenn Sie diesen Wert auf 0,1 setzen, bedeutet dies, dass Milvus nur Datenlöschungen mit einer Geschwindigkeit von 0,1 MB/s zulässt.
  • Um diese Einstellung zu verwenden, setzen Sie gleichzeitig quotaAndLimits.dml.enabled auf true.
  • -1

    quotaAndLimits.dml.deleteRate.db.max

    Beschreibung Standardwert
    MB/s, standardmäßig keine Begrenzung -1

    quotaAndLimits.dml.deleteRate.collection.max

    Beschreibung Standardwert
  • Höchste Datenlöschrate pro Sekunde.
  • Die Einstellung 0,1 bedeutet, dass Milvus das Löschen von Daten aus einer Sammlung nur mit einer Rate von 0,1 MB/s erlaubt.
  • Um diese Einstellung zu verwenden, setzen Sie gleichzeitig quotaAndLimits.dml.enabled auf true.
  • -1

    quotaAndLimits.dml.deleteRate.partition.max

    Beschreibung Standardwert
    MB/s, standardmäßig keine Begrenzung -1

    quotaAndLimits.dml.bulkLoadRate.max

    Beschreibung Standardwert
    MB/s, standardmäßig kein Limit, wird noch nicht unterstützt. TODO: Begrenzung der BulkLoad-Rate -1

    quotaAndLimits.dml.bulkLoadRate.db.max

    Beschreibung Standardwert
    MB/s, standardmäßig keine Begrenzung, wird noch nicht unterstützt. TODO: db bulkLoad rate begrenzen -1

    quotaAndLimits.dml.bulkLoadRate.collection.max

    Beschreibung Standardwert
    MB/s, standardmäßig keine Begrenzung, wird noch nicht unterstützt. TODO: limit collection bulkLoad rate -1

    quotaAndLimits.dml.bulkLoadRate.partition.max

    Beschreibung Standardwert
    MB/s, standardmäßig keine Begrenzung, wird noch nicht unterstützt. TODO: Partition bulkLoad rate begrenzen -1

    quotaAndLimits.dql.enabled

    Beschreibung Standardwert
    Ob die DQL-Anforderungsdrosselung aktiviert ist. false

    quotaAndLimits.dql.searchRate.max

    Beschreibung Standardwert
  • Maximale Anzahl der zu durchsuchenden Vektoren pro Sekunde.
  • Der Wert 100 bedeutet, dass Milvus nur 100 Vektoren pro Sekunde durchsuchen darf, unabhängig davon, ob diese 100 Vektoren in einer einzigen Suche oder über mehrere Suchen verteilt sind.
  • Um diese Einstellung zu verwenden, setzen Sie gleichzeitig quotaAndLimits.dql.enabled auf true.
  • -1

    quotaAndLimits.dql.searchRate.db.max

    Beschreibung Standardwert
    vps (Vektoren pro Sekunde), standardmäßig keine Begrenzung -1

    quotaAndLimits.dql.searchRate.collection.max

    Beschreibung Standardwert
  • Maximale Anzahl der zu durchsuchenden Vektoren pro Sammlung und Sekunde.
  • Wenn dieser Wert auf 100 gesetzt wird, erlaubt Milvus nur die Suche von 100 Vektoren pro Sekunde und Sammlung, unabhängig davon, ob diese 100 Vektoren alle in einer Suche oder über mehrere Suchen verteilt sind.
  • Um diese Einstellung zu verwenden, setzen Sie gleichzeitig quotaAndLimits.dql.enabled auf true.
  • -1

    quotaAndLimits.dql.searchRate.partition.max

    Beschreibung Standardwert
    vps (Vektoren pro Sekunde), standardmäßig keine Begrenzung -1

    quotaAndLimits.dql.queryRate.max

    Beschreibung Standardwert
  • Maximale Anzahl von Abfragen pro Sekunde.
  • Die Einstellung 100 bedeutet, dass Milvus nur 100 Abfragen pro Sekunde zulässt.
  • Um diese Einstellung zu verwenden, setzen Sie gleichzeitig quotaAndLimits.dql.enabled auf true.
  • -1

    quotaAndLimits.dql.queryRate.db.max

    Beschreibung Standardwert
    qps, standardmäßig keine Begrenzung -1

    quotaAndLimits.dql.queryRate.collection.max

    Beschreibung Standardwert
  • Maximale Anzahl von Abfragen pro Sammlung und Sekunde.
  • Die Einstellung 100 bedeutet, dass Milvus nur 100 Abfragen pro Sammlung pro Sekunde zulässt.
  • Um diese Einstellung zu verwenden, setzen Sie gleichzeitig quotaAndLimits.dql.enabled auf true.
  • -1

    quotaAndLimits.dql.queryRate.partition.max

    Beschreibung Standardwert
    qps, standardmäßig keine Begrenzung -1

    quotaAndLimits.limitWriting.forceDeny

    Beschreibung Standardwert
  • forceDeny false bedeutet, dass dml-Anfragen erlaubt sind (außer bei einigen
  • bestimmten Bedingungen, wie z.B. Speicher der Knoten zur Wassermarkierung), true bedeutet, dass alle dml-Anfragen immer abgelehnt werden.
  • false

    quotaAndLimits.limitWriting.ttProtection.maxTimeTickDelay

    Beschreibung Standardwert
  • maxTimeTickDelay gibt den Gegendruck für DML-Operationen an.
  • Die DML-Raten werden entsprechend dem Verhältnis von time tick delay zu maxTimeTickDelay reduziert,
  • Wenn die Zeitverzögerung größer als maxTimeTickDelay ist, werden alle DML-Anforderungen zurückgewiesen.
  • Sekunden
  • 300

    quotaAndLimits.limitWriting.memProtection.enabled

    Beschreibung Standardwert
  • Wenn Speichernutzung > memoryHighWaterLevel, werden alle DML-Anforderungen abgelehnt;
  • Wenn memoryLowWaterLevel < memory usage < memoryHighWaterLevel, wird die dml-Rate reduziert;
  • Wenn Speichernutzung < memoryLowWaterLevel, keine Aktion.
  • true

    quotaAndLimits.limitWriting.memProtection.dataNodeMemoryLowWaterLevel

    Beschreibung Standardwert
    (0, 1], memoryLowWaterLevel in DataNodes 0.85

    quotaAndLimits.limitWriting.memProtection.dataNodeMemoryHighWaterLevel

    Beschreibung Standardwert
    (0, 1], SpeicherHochWasserstand in Datenknoten 0.95

    quotaAndLimits.limitWriting.memProtection.queryNodeMemoryLowWaterLevel

    Beschreibung Standardwert
    (0, 1], memoryLowWaterLevel in QueryNodes 0.85

    quotaAndLimits.limitWriting.memProtection.queryNodeMemoryHighWaterLevel

    Beschreibung Standardwert
    (0, 1], memoryHighWaterLevel in QueryNodes 0.95

    quotaAndLimits.limitWriting.growingSegmentsSizeProtection.enabled

    Beschreibung Standardwert
  • Es werden keine Maßnahmen ergriffen, wenn die Größe der wachsenden Segmente kleiner als die niedrige Wasserstandsmarke ist.
  • Wenn die Größe der wachsenden Segmente das niedrige Wasserzeichen überschreitet, wird die dml-Rate reduziert,
  • aber die Rate wird nicht niedriger als minRateRatio * dmlRate sein.
  • false

    quotaAndLimits.limitWriting.diskProtection.enabled

    Beschreibung Standardwert
    Wenn die gesamte Dateigröße des Objektspeichers größer ist als `diskQuota`, werden alle dml-Anfragen abgelehnt; true

    quotaAndLimits.limitWriting.diskProtection.diskQuota

    Beschreibung Standardwert
    MB, (0, +inf), standardmäßig kein Limit -1

    quotaAndLimits.limitWriting.diskProtection.diskQuotaPerDB

    Beschreibung Standardwert
    MB, (0, +inf), Voreinstellung kein Limit -1

    quotaAndLimits.limitWriting.diskProtection.diskQuotaPerCollection

    Beschreibung Standardwert
    MB, (0, +inf), Voreinstellung kein Limit -1

    quotaAndLimits.limitWriting.diskProtection.diskQuotaPerPartition

    Beschreibung Standardwert
    MB, (0, +inf), Voreinstellung kein Limit -1

    quotaAndLimits.limitWriting.l0SegmentsRowCountProtection.enabled

    Beschreibung Standardwert
    Schalter zum Aktivieren der L0-Segment-Zeilenanzahl-Quote falsch

    quotaAndLimits.limitWriting.l0SegmentsRowCountProtection.lowWaterLevel

    Beschreibung Standardwert
    l0-Segment Zeilenzählung Quote, Niedrigwasserstand 30000000

    quotaAndLimits.limitWriting.l0SegmentsRowCountProtection.highWaterLevel

    Beschreibung Standardwert
    l0 Segment Zeilenzählung Quote, hoher Wasserstand 50000000

    quotaAndLimits.limitWriting.deleteBufferRowCountProtection.enabled

    Beschreibung Standardwert
    Schalter zum Aktivieren der Quote für die Anzahl der Löschpufferzeilen falsch

    quotaAndLimits.limitWriting.deleteBufferRowCountProtection.lowWaterLevel

    Beschreibung Standardwert
    Quote für das Löschen der Pufferzeilenanzahl, niedriger Wasserstand 32768

    quotaAndLimits.limitWriting.deleteBufferRowCountProtection.highWaterLevel

    Beschreibung Standardwert
    Puffer Zeilenzählkontingent löschen, hoher Wasserstand 65536

    quotaAndLimits.limitWriting.deleteBufferSizeProtection.enabled

    Beschreibung Standardwert
    Schalter zum Aktivieren der Quote für die Größe des Löschpuffers falsch

    quotaAndLimits.limitWriting.deleteBufferSizeProtection.lowWaterLevel

    Beschreibung Standardwert
    Quote für die Puffergröße löschen, niedriger Wasserstand 134217728

    quotaAndLimits.limitWriting.deleteBufferSizeProtection.highWaterLevel

    Beschreibung Standardwert
    Quote für Puffergröße löschen, hoher Wasserstand 268435456

    quotaAndLimits.limitReading.forceDeny

    Beschreibung Standardwert
  • forceDeny false bedeutet, dass dql-Anfragen erlaubt sind (außer bei einigen
  • Bedingungen, wie z.B. Sammlung wurde gelöscht), true bedeutet, dass alle dql-Anfragen immer abgelehnt werden.
  • false
    Tabelle der Inhalte

    Try Managed Milvus for Free

    Zilliz Cloud is hassle-free, powered by Milvus and 10x faster.

    Get Started
    Feedback

    War diese Seite hilfreich?