milvus-logo
LFAI
Casa
  • Guida all'amministrazione

Configurazioni relative a quote e limiti

QuotaConfig, configurazioni della quota e dei limiti di Milvus.

Per impostazione predefinita, sono abilitati:

  1. Protezione TT;

  2. Protezione della memoria.

  3. Protezione della quota disco.

È possibile abilitare:

  1. Limitazione del throughput DML;

  2. Limitazione DDL, DQL qps/rps;

  3. Protezione della lunghezza/latenza della coda DQL;

  4. Protezione della velocità dei risultati DQL;

Se necessario, si può anche forzare manualmente il rifiuto delle richieste RW.

quotaAndLimits.enabled

Descrizione Valore predefinito
`true` per abilitare la quota e i limiti, `false` per disabilitare. vero

quotaAndLimits.quotaCenterCollectInterval

Descrizione Valore predefinito
  • quotaCenterCollectInterval è l'intervallo di tempo in cui quotaCenter
  • raccoglie le metriche da Proxy, Query cluster e Data cluster.
  • secondi, (0 ~ 65536)
  • 3

    quotaAndLimits.limits.allocRetryTimes

    Descrizione Valore predefinito
    tempi di riprova quando l'eliminazione dell'allocazione dei dati di inoltro dal limite di velocità è fallita 15

    quotaAndLimits.limits.allocWaitInterval

    Descrizione Valore predefinito
    durata dell'attesa del tentativo quando l'eliminazione dell'allocazione dei dati in avanti non è riuscita, in millisecondi 1000

    quotaAndLimits.limits.complexDeleteLimitEnable

    Descrizione Valore predefinito
    se cancellare il controllo complesso dei dati di inoltro da parte del limitatore falso

    quotaAndLimits.limits.maxCollectionNumPerDB

    Descrizione Valore predefinito
    Numero massimo di raccolte per database. 65536

    quotaAndLimits.limits.maxInsertSize

    Descrizione Valore predefinito
    dimensione massima di una singola richiesta di inserimento, in byte, -1 significa nessun limite -1

    quotaAndLimits.limits.maxResourceGroupNumOfQueryNode

    Descrizione Valore predefinito
    numero massimo di gruppi di risorse dei nodi di interrogazione 1024

    quotaAndLimits.ddl.enabled

    Descrizione Valore predefinito
    Se la strozzatura delle richieste DDL è abilitata. falso

    quotaAndLimits.ddl.collectionRate

    Descrizione Valore predefinito
  • Numero massimo di richieste DDL relative alla raccolta al secondo.
  • L'impostazione di questa voce a 10 indica che Milvus non elabora più di 10 richieste DDL relative alla raccolta al secondo, comprese le richieste di creazione della raccolta, le richieste di abbandono della raccolta, le richieste di caricamento della raccolta e le richieste di rilascio della raccolta.
  • Per utilizzare questa impostazione, impostare contemporaneamente quotaAndLimits.ddl.enabled su true.
  • -1

    quotaAndLimits.ddl.partitionRate

    Descrizione Valore predefinito
  • Numero massimo di richieste DDL relative alla partizione al secondo.
  • L'impostazione di questa voce a 10 indica che Milvus non elabora più di 10 richieste al secondo relative alle partizioni, comprese le richieste di creazione di partizioni, di abbandono di partizioni, di caricamento di partizioni e di rilascio di partizioni.
  • Per utilizzare questa impostazione, impostare contemporaneamente quotaAndLimits.ddl.enabled su true.
  • -1

    quotaAndLimits.ddl.db.collectionRate

    Descrizione Valore predefinito
    qps del livello db, valore predefinito nessun limite, velocità per CreateCollection, DropCollection, LoadCollection, ReleaseCollection -1

    quotaAndLimits.ddl.db.partitionRate

    Descrizione Valore predefinito
    qps del livello del db, default nessun limite, frequenza per CreatePartition, DropPartition, LoadPartition, ReleasePartition -1

    quotaAndLimits.indexRate.enabled

    Descrizione Valore predefinito
    Se è abilitato il throttling delle richieste relative agli indici. falso

    quotaAndLimits.indexRate.max

    Descrizione Valore predefinito
  • Numero massimo di richieste relative agli indici al secondo.
  • L'impostazione di questa voce a 10 indica che Milvus non elabora più di 10 richieste relative a partizioni al secondo, comprese le richieste di creazione e di abbandono di indici.
  • Per utilizzare questa impostazione, impostare contemporaneamente quotaAndLimits.indexRate.enabled su true.
  • -1

    quotaAndLimits.indexRate.db.max

    Descrizione Valore predefinito
    qps del livello db, predefinito nessun limite, tasso per CreateIndex, DropIndex -1

    quotaAndLimits.flushRate.enabled

    Descrizione Valore predefinito
    Abilita o meno il throttling delle richieste di flush. vero

    quotaAndLimits.flushRate.max

    Descrizione Valore predefinito
  • Numero massimo di richieste di lavaggio al secondo.
  • L'impostazione di questa voce a 10 indica che Milvus non elabora più di 10 richieste di lavaggio al secondo.
  • Per utilizzare questa impostazione, impostare contemporaneamente quotaAndLimits.flushRate.enabled su true.
  • -1

    quotaAndLimits.flushRate.collection.max

    Descrizione Valore predefinito
    qps, default nessun limite, velocità di lavaggio a livello di raccolta. 0.1

    quotaAndLimits.flushRate.db.max

    Descrizione Valore predefinito
    qps del livello db, per impostazione predefinita nessun limite, velocità per il lavaggio -1

    quotaAndLimits.compactionRate.enabled

    Descrizione Valore predefinito
    Abilita o meno la limitazione manuale delle richieste di compattazione. falso

    quotaAndLimits.compactionRate.max

    Descrizione Valore predefinito
  • Numero massimo di richieste di compattazione manuale al secondo.
  • L'impostazione di questa voce a 10 indica che Milvus non elabora più di 10 richieste di compattazione manuale al secondo.
  • Per utilizzare questa impostazione, impostare contemporaneamente quotaAndLimits.compaction.enabled su true.
  • -1

    quotaAndLimits.compactionRate.db.max

    Descrizione Valore predefinito
    qps del livello db, default nessun limite, tasso per la Compattazione manuale -1

    quotaAndLimits.dml.enabled

    Descrizione Valore predefinito
    Abilita o meno la limitazione delle richieste DML. falso

    quotaAndLimits.dml.insertRate.max

    Descrizione Valore predefinito
  • Velocità massima di inserimento dei dati al secondo.
  • L'impostazione di questa voce a 5 indica che Milvus consente l'inserimento dei dati solo alla velocità di 5 MB/s.
  • Per utilizzare questa impostazione, impostare contemporaneamente quotaAndLimits.dml.enabled su true.
  • -1

    quotaAndLimits.dml.insertRate.db.max

    Descrizione Valore predefinito
    MB/s, default nessun limite -1

    quotaAndLimits.dml.insertRate.collection.max

    Descrizione Valore predefinito
  • Velocità massima di inserimento dati per raccolta al secondo.
  • L'impostazione di questa voce a 5 indica che Milvus consente l'inserimento di dati in qualsiasi raccolta solo alla velocità di 5 MB/s.
  • Per utilizzare questa impostazione, impostare contemporaneamente quotaAndLimits.dml.enabled su true.
  • -1

    quotaAndLimits.dml.insertRate.partition.max

    Descrizione Valore predefinito
    MB/s, default nessun limite -1

    quotaAndLimits.dml.upsertRate.max

    Descrizione Valore predefinito
    MB/s, default nessun limite -1

    quotaAndLimits.dml.upsertRate.db.max

    Descrizione Valore predefinito
    MB/s, default nessun limite -1

    quotaAndLimits.dml.upsertRate.collection.max

    Descrizione Valore predefinito
    MB/s, default nessun limite -1

    quotaAndLimits.dml.upsertRate.partition.max

    Descrizione Valore predefinito
    MB/s, default nessun limite -1

    quotaAndLimits.dml.deleteRate.max

    Descrizione Valore predefinito
  • Velocità massima di cancellazione dei dati al secondo.
  • L'impostazione di questa voce a 0,1 indica che Milvus consente l'eliminazione dei dati solo alla velocità di 0,1 MB/s.
  • Per utilizzare questa impostazione, impostare contemporaneamente quotaAndLimits.dml.enabled su true.
  • -1

    quotaAndLimits.dml.deleteRate.db.max

    Descrizione Valore predefinito
    MB/s, default nessun limite -1

    quotaAndLimits.dml.deleteRate.collection.max

    Descrizione Valore predefinito
  • Velocità massima di cancellazione dei dati al secondo.
  • L'impostazione di questa voce a 0,1 indica che Milvus consente solo l'eliminazione dei dati da qualsiasi raccolta alla velocità di 0,1 MB/s.
  • Per utilizzare questa impostazione, impostare contemporaneamente quotaAndLimits.dml.enabled su true.
  • -1

    quotaAndLimits.dml.deleteRate.partition.max

    Descrizione Valore predefinito
    MB/s, predefinito nessun limite -1

    quotaAndLimits.dml.bulkLoadRate.max

    Descrizione Valore predefinito
    MB/s, default nessun limite, non ancora supportato. TODO: limitare la velocità di bulkload -1

    quotaAndLimits.dml.bulkLoadRate.db.max

    Descrizione Valore predefinito
    MB/s, default nessun limite, non ancora supportato. TODO: limitare la velocità di caricamento del db bulkLoad -1

    quotaAndLimits.dml.bulkLoadRate.collection.max

    Descrizione Valore predefinito
    MB/s, default nessun limite, non ancora supportato. TODO: limitare la velocità di caricamento della raccolta -1

    quotaAndLimits.dml.bulkLoadRate.partition.max

    Descrizione Valore predefinito
    MB/s, per impostazione predefinita nessun limite, non ancora supportato. TODO: limitare la velocità di caricamento della partizione -1

    quotaAndLimits.dql.enabled

    Descrizione Valore predefinito
    Abilita o meno la limitazione delle richieste DQL. falso

    quotaAndLimits.dql.searchRate.max

    Descrizione Valore predefinito
  • Numero massimo di vettori da cercare al secondo.
  • L'impostazione di questa voce a 100 indica che Milvus consente di cercare solo 100 vettori al secondo, indipendentemente dal fatto che questi 100 vettori siano tutti in un'unica ricerca o sparsi in più ricerche.
  • Per utilizzare questa impostazione, impostare contemporaneamente quotaAndLimits.dql.enabled su true.
  • -1

    quotaAndLimits.dql.searchRate.db.max

    Descrizione Valore predefinito
    vps (vettori al secondo), predefinito nessun limite -1

    quotaAndLimits.dql.searchRate.collection.max

    Descrizione Valore predefinito
  • Numero massimo di vettori da cercare per collezione al secondo.
  • L'impostazione di questa voce a 100 indica che Milvus consente di cercare solo 100 vettori al secondo per collezione, indipendentemente dal fatto che questi 100 vettori siano tutti in un'unica ricerca o sparsi in più ricerche.
  • Per utilizzare questa impostazione, impostare contemporaneamente quotaAndLimits.dql.enabled su true.
  • -1

    quotaAndLimits.dql.searchRate.partition.max

    Descrizione Valore predefinito
    vps (vettori al secondo), predefinito nessun limite -1

    quotaAndLimits.dql.queryRate.max

    Descrizione Valore predefinito
  • Numero massimo di query al secondo.
  • L'impostazione di questa voce a 100 indica che Milvus consente solo 100 query al secondo.
  • Per utilizzare questa impostazione, impostare contemporaneamente quotaAndLimits.dql.enabled su true.
  • -1

    quotaAndLimits.dql.queryRate.db.max

    Descrizione Valore predefinito
    qps, default nessun limite -1

    quotaAndLimits.dql.queryRate.collection.max

    Descrizione Valore predefinito
  • Numero massimo di interrogazioni per raccolta al secondo.
  • L'impostazione di questa voce a 100 indica che Milvus consente solo 100 query per raccolta al secondo.
  • Per utilizzare questa impostazione, impostare contemporaneamente quotaAndLimits.dql.enabled su true.
  • -1

    quotaAndLimits.dql.queryRate.partition.max

    Descrizione Valore predefinito
    qps, default nessun limite -1

    quotaAndLimits.limitWriting.forceDeny

    Descrizione Valore predefinito
  • forceDeny false significa che le richieste dml sono consentite (eccetto per alcune condizioni specifiche, come la memoria dei nodi per il marcatore dell'acqua).
  • condizioni specifiche, come la memoria dei nodi da marcare con l'acqua), true significa che le richieste dml sono sempre rifiutate.
  • falso

    quotaAndLimits.limitWriting.ttProtection.maxTimeTickDelay

    Descrizione Valore predefinito
  • maxTimeTickDelay indica la pressione posteriore per le operazioni DML.
  • La velocità delle operazioni DML viene ridotta in base al rapporto tra il ritardo dei tick temporali e maxTimeTickDelay,
  • se il ritardo è superiore a maxTimeTickDelay, tutte le richieste DML vengono rifiutate.
  • secondi
  • 300

    quotaAndLimits.limitWriting.memProtection.enabled

    Descrizione Valore predefinito
  • Quando l'utilizzo della memoria > memoryHighWaterLevel, tutte le richieste DML vengono rifiutate;
  • Quando memoryLowWaterLevel < memory usage < memoryHighWaterLevel, ridurre la velocità del dml;
  • Quando l'utilizzo della memoria < memoryLowWaterLevel, nessuna azione.
  • vero

    quotaAndLimits.limitWriting.memProtection.dataNodeMemoryLowWaterLevel

    Descrizione Valore predefinito
    (0, 1], memoryLowWaterLevel in DataNodes 0.85

    quotaAndLimits.limitWriting.memProtection.dataNodeMemoryHighWaterLevel

    Descrizione Valore predefinito
    (0, 1], memoryHighWaterLevel in DataNodes 0.95

    quotaAndLimits.limitWriting.memProtection.queryNodeMemoryLowWaterLevel

    Descrizione Valore predefinito
    (0, 1], memoryLowWaterLevel in QueryNodes 0.85

    quotaAndLimits.limitWriting.memProtection.queryNodeMemoryHighWaterLevel

    Descrizione Valore predefinito
    (0, 1], memoryHighWaterLevel in QueryNodes 0.95

    quotaAndLimits.limitWriting.growingSegmentsSizeProtection.enabled

    Descrizione Valore predefinito
  • Se la dimensione dei segmenti in crescita è inferiore alla filigrana bassa, non verrà intrapresa alcuna azione.
  • Quando la dimensione dei segmenti in crescita supera la filigrana bassa, la velocità dml verrà ridotta,
  • ma la velocità non sarà inferiore a minRateRatio * dmlRate.
  • falso

    quotaAndLimits.limitWriting.diskProtection.enabled

    Descrizione Valore predefinito
    Quando la dimensione totale del file di archiviazione degli oggetti è superiore a `diskQuota`, tutte le richieste dml vengono rifiutate; vero

    quotaAndLimits.limitWriting.diskProtection.diskQuota

    Descrizione Valore predefinito
    MB, (0, +inf), default nessun limite -1

    quotaAndLimits.limitWriting.diskProtection.diskQuotaPerDB

    Descrizione Valore predefinito
    MB, (0, +inf), default nessun limite -1

    quotaAndLimits.limitWriting.diskProtection.diskQuotaPerCollection

    Descrizione Valore predefinito
    MB, (0, +inf), default nessun limite -1

    quotaAndLimits.limitWriting.diskProtection.diskQuotaPerPartition

    Descrizione Valore predefinito
    MB, (0, +inf), default nessun limite -1

    quotaAndLimits.limitWriting.l0SegmentsRowCountProtection.enabled

    Descrizione Valore predefinito
    interruttore per abilitare la quota del conteggio delle righe del segmento l0 falso

    quotaAndLimits.limitWriting.l0SegmentsRowCountProtection.lowWaterLevel

    Descrizione Valore predefinito
    quota conteggio righe segmento l0, livello acqua basso 32768

    quotaAndLimits.limitWriting.l0SegmentsRowCountProtection.highWaterLevel

    Descrizione Valore predefinito
    Quota conteggio righe segmento l0, livello acqua basso 65536

    quotaAndLimits.limitReading.forceDeny

    Descrizione Valore predefinito
  • forceDeny false significa che le richieste dql sono consentite (tranne che per alcune
  • condizioni specifiche, come l'abbandono della raccolta), true significa che tutte le richieste dql vengono sempre rifiutate.
  • falso

    quotaAndLimits.limitReading.queueProtection.nqInQueueThreshold

    Descrizione Valore predefinito
  • nqInQueueThreshold indica che il sistema è sotto pressione per il percorso di ricerca/query.
  • Se l'NQ nella coda di un qualsiasi QueryNode è maggiore di nqInQueueThreshold, i tassi di ricerca e di interrogazione si abbassano gradualmente
  • fino a quando l'NQ nella coda non supera più la soglia nqInQueueThreshold. Si considera l'NQ della richiesta di query come 1.
  • int, default nessun limite
  • -1

    quotaAndLimits.limitReading.queueProtection.queueLatencyThreshold

    Descrizione Valore predefinito
  • queueLatencyThreshold indica che il sistema è sotto pressione per il percorso di ricerca/query.
  • Se la latenza dql dell'accodamento è maggiore di queueLatencyThreshold, i tassi di search&query si raffreddano gradualmente
  • fino a quando la latenza di accodamento non supera più la soglia di queueLatencyThreshold.
  • La latenza si riferisce alla latenza media su un periodo di tempo.
  • millisecondi, default nessun limite
  • -1

    quotaAndLimits.limitReading.resultProtection.maxReadResultRate

    Descrizione Valore predefinito
  • maxReadResultRate indicava che il sistema era sotto pressione per il percorso di ricerca/query.
  • Se la velocità dei risultati dql è superiore a maxReadResultRate, la velocità di ricerca e interrogazione si riduce gradualmente fino a quando la velocità dei risultati di lettura non supera più maxReadResultRate.
  • fino a quando la velocità di lettura dei risultati non supera più maxReadResultRate.
  • MB/s, default nessun limite
  • -1

    quotaAndLimits.limitReading.coolOffSpeed

    Descrizione Valore predefinito
  • colOffSpeed è la velocità di raffreddamento dei tassi di ricerca e interrogazione.
  • (0, 1]
  • 0.9

    Tradotto daDeepL

    Tabella dei contenuti

    Try Managed Milvus for Free

    Zilliz Cloud is hassle-free, powered by Milvus and 10x faster.

    Get Started
    Feedback

    Questa pagina è stata utile?