milvus-logo
LFAI
Home
  • Guía de administración

Configuraciones relacionadas con quotaAndLimits

QuotaConfig, configuraciones de cuota y límites de Milvus.

Por defecto, habilitamos:

  1. Protección TT;

  2. Protección de memoria.

  3. Protección de cuota de disco.

Puede habilitar:

  1. Limitación del rendimiento de DML;

  2. DDL, DQL qps/rps limitación;

  3. Protección de longitud/latencia de colas DQL;

  4. Protección de la tasa de resultados DQL;

Si es necesario, también puede forzar manualmente la denegación de peticiones RW.

quotaAndLimits.enabled

Descripción Valor por defecto
`true` para habilitar cuota y límites, `false` para deshabilitar. verdadero

quotaAndLimits.quotaCenterCollectInterval

Descripción Valor por defecto
  • quotaCenterCollectInterval es el intervalo de tiempo que quotaCenter
  • recopila métricas de Proxies, clúster de consultas y clúster de datos.
  • segundos, (0 ~ 65536)
  • 3

    quotaAndLimits.limits.allocRetryTimes

    Descripción Valor por defecto
    Tiempos de reintento cuando falla la eliminación de datos de asignación de reenvío de límite de tasa 15

    quotaAndLimits.limits.allocWaitInterval

    Descripción Valor por defecto
    duración de la espera de reintento cuando falla la tasa de transferencia de datos, en milisegundos 1000

    quotaAndLimits.limits.complexDeleteLimitEnable

    Descripción Valor por defecto
    si el borrado complejo comprueba los datos enviados por el limitador falso

    quotaAndLimits.limits.maxCollectionNumPerDB

    Descripción Valor por defecto
    Número máximo de colecciones por base de datos. 65536

    quotaAndLimits.limits.maxInsertSize

    Descripción Valor por defecto
    tamaño máximo de una única solicitud de inserción, en bytes, -1 significa sin límite -1

    quotaAndLimits.limits.maxResourceGroupNumOfQueryNode

    Descripción Valor por defecto
    número máximo de grupos de recursos de nodos de consulta 1024

    quotaAndLimits.ddl.enabled

    Descripción Valor por defecto
    Si está activado el estrangulamiento de peticiones DDL. falso

    quotaAndLimits.ddl.collectionRate

    Descripción Valor por defecto
  • Número máximo de peticiones DDL relacionadas con la colección por segundo.
  • Establecer este elemento en 10 indica que Milvus no procesa más de 10 solicitudes DDL relacionadas con colecciones por segundo, incluidas las solicitudes de creación de colecciones, las solicitudes de eliminación de colecciones, las solicitudes de carga de colecciones y las solicitudes de liberación de colecciones.
  • Para utilizar esta configuración, establezca quotaAndLimits.ddl.enabled en true al mismo tiempo.
  • -1

    quotaAndLimits.ddl.partitionRate

    Descripción Valor por defecto
  • Número máximo de peticiones DDL relacionadas con particiones por segundo.
  • Establecer este elemento a 10 indica que Milvus no procesa más de 10 peticiones relacionadas con particiones por segundo, incluyendo peticiones de creación de particiones, peticiones de eliminación de particiones, peticiones de carga de particiones y peticiones de liberación de particiones.
  • Para usar este ajuste, establezca quotaAndLimits.ddl.enabled a true al mismo tiempo.
  • -1

    quotaAndLimits.ddl.db.collectionRate

    Descripción Valor por defecto
    qps de nivel db , por defecto sin límite, tasa para CreateCollection, DropCollection, LoadCollection, ReleaseCollection -1

    quotaAndLimits.ddl.db.partitionRate

    Descripción Valor por defecto
    qps de nivel de base de datos, por defecto sin límite, tasa para CreatePartition, DropPartition, LoadPartition, ReleasePartition -1

    quotaAndLimits.indexRate.enabled

    Descripción Valor por defecto
    Si está habilitada la limitación de peticiones relacionadas con índices. falso

    quotaAndLimits.indexRate.max

    Descripción Valor por defecto
  • Número máximo de peticiones relacionadas con índices por segundo.
  • Establecer este ítem a 10 indica que Milvus no procesa más de 10 peticiones relacionadas con particiones por segundo, incluyendo peticiones de creación de índices y peticiones de caída de índices.
  • Para utilizar esta configuración, establezca quotaAndLimits.indexRate.enabled a true al mismo tiempo.
  • -1

    quotaAndLimits.indexRate.db.max

    Descripción Valor por defecto
    qps de nivel db, por defecto sin límite, tasa para CreateIndex, DropIndex -1

    quotaAndLimits.flushRate.enabled

    Descripción Valor por defecto
    Si está activada la limitación de peticiones de descarga. verdadero

    quotaAndLimits.flushRate.max

    Descripción Valor por defecto
  • Número máximo de peticiones de descarga por segundo.
  • Establecer este elemento a 10 indica que Milvus no procesa más de 10 peticiones de descarga por segundo.
  • Para utilizar esta configuración, establezca quotaAndLimits.flushRate.enabled en true al mismo tiempo.
  • -1

    quotaAndLimits.flushRate.collection.max

    Descripción Valor por defecto
    qps, por defecto sin límite, tasa de descarga a nivel de colección. 0.1

    quotaAndLimits.flushRate.db.max

    Descripción Valor por defecto
    qps de nivel db, por defecto sin límite, tasa para descarga -1

    quotaAndLimits.compactionRate.enabled

    Descripción Valor por defecto
    Si está habilitada la limitación manual de peticiones de compactación. falso

    quotaAndLimits.compactionRate.max

    Descripción Valor por defecto
  • Número máximo de peticiones de compactación manual por segundo.
  • Establecer este elemento a 10 indica que Milvus no procesa más de 10 peticiones de compactación manual por segundo.
  • Para utilizar esta configuración, establezca quotaAndLimits.compaction.enabled en true al mismo tiempo.
  • -1

    quotaAndLimits.compactionRate.db.max

    Descripción Valor por defecto
    qps de nivel db, por defecto sin límite, tasa para compactación manual -1

    quotaAndLimits.dml.enabled

    Descripción Valor por defecto
    Si está habilitada la limitación de peticiones DML. falso

    quotaAndLimits.dml.insertRate.max

    Descripción Valor por defecto
  • Velocidad máxima de inserción de datos por segundo.
  • Establecer este elemento en 5 indica que Milvus sólo permite la inserción de datos a una velocidad de 5 MB/s.
  • Para utilizar esta configuración, establezca quotaAndLimits.dml.enabled en true al mismo tiempo.
  • -1

    quotaAndLimits.dml.insertRate.db.max

    Descripción Valor por defecto
    MB/s, por defecto sin límite -1

    quotaAndLimits.dml.insertRate.collection.max

    Descripción Valor por defecto
  • Velocidad máxima de inserción de datos por colección por segundo.
  • Establecer este elemento en 5 indica que Milvus sólo permite la inserción de datos en cualquier colección a una velocidad de 5 MB/s.
  • Para utilizar esta configuración, establezca quotaAndLimits.dml.enabled en true al mismo tiempo.
  • -1

    quotaAndLimits.dml.insertRate.partition.max

    Descripción Valor por defecto
    MB/s, por defecto sin límite -1

    quotaAndLimits.dml.upsertRate.max

    Descripción Valor por defecto
    MB/s, por defecto sin límite -1

    quotaAndLimits.dml.upsertRate.db.max

    Descripción Valor por defecto
    MB/s, por defecto sin límite -1

    quotaAndLimits.dml.upsertRate.collection.max

    Descripción Valor por defecto
    MB/s, por defecto sin límite -1

    quotaAndLimits.dml.upsertRate.partition.max

    Descripción Valor por defecto
    MB/s, por defecto sin límite -1

    quotaAndLimits.dml.deleteRate.max

    Descripción Valor por defecto
  • Tasa máxima de borrado de datos por segundo.
  • Establecer este elemento a 0.1 indica que Milvus sólo permite el borrado de datos a una velocidad de 0.1 MB/s.
  • Para utilizar esta configuración, establezca quotaAndLimits.dml.enabled en true al mismo tiempo.
  • -1

    quotaAndLimits.dml.deleteRate.db.max

    Descripción Valor por defecto
    MB/s, por defecto sin límite -1

    quotaAndLimits.dml.deleteRate.collection.max

    Descripción Valor por defecto
  • Tasa máxima de borrado de datos por segundo.
  • Establecer este elemento en 0,1 indica que Milvus sólo permite el borrado de datos de cualquier colección a una velocidad de 0,1 MB/s.
  • Para utilizar esta configuración, establezca quotaAndLimits.dml.enabled en true al mismo tiempo.
  • -1

    quotaAndLimits.dml.deleteRate.partition.max

    Descripción Valor por defecto
    MB/s, por defecto sin límite -1

    quotaAndLimits.dml.bulkLoadRate.max

    Descripción Valor por defecto
    MB/s, por defecto sin limite, no soportado todavia. TODO: limitar tasa bulkLoad -1

    quotaAndLimits.dml.bulkLoadRate.db.max

    Descripción Valor por defecto
    MB/s, por defecto sin limite, no soportado todavia. TODO: limitar db bulkLoad rate -1

    quotaAndLimits.dml.bulkLoadRate.collection.max

    Descripción Valor por defecto
    MB/s, por defecto sin limite, no soportado todavia. TODO: limitar tasa bulkLoad de recoleccion -1

    quotaAndLimits.dml.bulkLoadRate.partition.max

    Descripción Valor por defecto
    MB/s, por defecto sin limite, no soportado todavia. TODO: limitar velocidad de carga masiva de particiones -1

    quotaAndLimits.dql.enabled

    Descripción Valor por defecto
    Si la limitación de peticiones DQL está habilitada. falso

    quotaAndLimits.dql.searchRate.max

    Descripción Valor por defecto
  • Número máximo de vectores a buscar por segundo.
  • Establecer este elemento a 100 indica que Milvus sólo permite buscar 100 vectores por segundo sin importar si estos 100 vectores están todos en una búsqueda o dispersos en múltiples búsquedas.
  • Para utilizar esta configuración, establezca quotaAndLimits.dql.enabled en true al mismo tiempo.
  • -1

    quotaAndLimits.dql.searchRate.db.max

    Descripción Valor por defecto
    vps (vectores por segundo), por defecto sin límite -1

    quotaAndLimits.dql.searchRate.collection.max

    Descripción Valor por defecto
  • Número máximo de vectores a buscar por colección por segundo.
  • Establecer este elemento a 100 indica que Milvus sólo permite buscar 100 vectores por segundo por colección sin importar si estos 100 vectores están todos en una búsqueda o dispersos en múltiples búsquedas.
  • Para utilizar esta configuración, establezca quotaAndLimits.dql.enabled en true al mismo tiempo.
  • -1

    quotaAndLimits.dql.searchRate.partition.max

    Descripción Valor por defecto
    vps (vectores por segundo), por defecto sin límite -1

    quotaAndLimits.dql.queryRate.max

    Descripción Valor por defecto
  • Número máximo de consultas por segundo.
  • Establecer este elemento a 100 indica que Milvus sólo permite 100 consultas por segundo.
  • Para utilizar esta configuración, establezca quotaAndLimits.dql.enabled en true al mismo tiempo.
  • -1

    quotaAndLimits.dql.queryRate.db.max

    Descripción Valor por defecto
    qps, por defecto sin límite -1

    quotaAndLimits.dql.queryRate.collection.max

    Descripción Valor por defecto
  • Número máximo de consultas por colección por segundo.
  • Establecer este elemento a 100 indica que Milvus sólo permite 100 consultas por colección por segundo.
  • Para utilizar esta configuración, establezca quotaAndLimits.dql.enabled en true al mismo tiempo.
  • -1

    quotaAndLimits.dql.queryRate.partition.max

    Descripción Valor por defecto
    qps, por defecto sin límite -1

    quotaAndLimits.limitWriting.forceDeny

    Descripción Valor por defecto
  • forceDeny false significa que las peticiones dml están permitidas (excepto para algunas
  • condiciones específicas, como la memoria de nodos para el marcador de agua), true significa que siempre se rechazan todas las peticiones dml.
  • false

    quotaAndLimits.limitWriting.ttProtection.maxTimeTickDelay

    Descripción Valor por defecto
  • maxTimeTickDelay indica el backpressure para operaciones DML.
  • Las tasas de DML se reducirían de acuerdo con la relación entre el retardo de tictac de tiempo y maxTimeTickDelay,
  • si el time tick delay es mayor que maxTimeTickDelay, todas las peticiones DML serían rechazadas.
  • segundos
  • 300

    quotaAndLimits.limitWriting.memProtection.enabled

    Descripción Valor por defecto
  • Cuando memory usage > memoryHighWaterLevel, se rechazan todas las solicitudes DML;
  • Cuando memoryLowWaterLevel < memory usage < memoryHighWaterLevel, reduce la tasa de dml;
  • Cuando el uso de memoria < memoryLowWaterLevel, ninguna acción.
  • verdadero

    quotaAndLimits.limitWriting.memProtection.dataNodeMemoryLowWaterLevel

    Descripción Valor por defecto
    (0, 1], memoryLowWaterLevel en DataNodes 0.85

    quotaAndLimits.limitWriting.memProtection.dataNodeMemoryHighWaterLevel

    Descripción Valor por defecto
    (0, 1], memoryHighWaterLevel en DataNodes 0.95

    quotaAndLimits.limitWriting.memProtection.queryNodeMemoryLowWaterLevel

    Descripción Valor por defecto
    (0, 1], memoryLowWaterLevel en QueryNodes 0.85

    quotaAndLimits.limitWriting.memProtection.queryNodeMemoryHighWaterLevel

    Descripción Valor por defecto
    (0, 1], memoryHighWaterLevel en QueryNodes 0.95

    quotaAndLimits.limitWriting.growingSegmentsSizeProtection.enabled

    Descripción Valor por defecto
  • No se realizará ninguna acción si el tamaño de los segmentos en crecimiento es inferior a la marca de agua baja.
  • Cuando el tamaño de los segmentos en crecimiento supere la marca de agua baja, se reducirá la tasa de dml,
  • pero la tasa no será inferior a minRateRatio * dmlRate.
  • false

    quotaAndLimits.limitWriting.diskProtection.enabled

    Descripción Valor por defecto
    Cuando el tamaño total del archivo de almacenamiento de objetos es mayor que `diskQuota`, todas las peticiones dml serán rechazadas; true

    quotaAndLimits.limitWriting.diskProtection.diskQuota

    Descripción Valor por defecto
    MB, (0, +inf), por defecto sin límite -1

    quotaAndLimits.limitWriting.diskProtection.diskQuotaPerDB

    Descripción Valor por defecto
    MB, (0, +inf), por defecto sin límite -1

    quotaAndLimits.limitWriting.diskProtection.diskQuotaPerCollection

    Descripción Valor por defecto
    MB, (0, +inf), por defecto sin límite -1

    quotaAndLimits.limitWriting.diskProtection.diskQuotaPerPartition

    Descripción Valor por defecto
    MB, (0, +inf), por defecto sin límite -1

    quotaAndLimits.limitWriting.l0SegmentsRowCountProtection.enabled

    Descripción Valor por defecto
    interruptor para activar la cuota de recuento de filas del segmento l0 falso

    quotaAndLimits.limitWriting.l0SegmentsRowCountProtection.lowWaterLevel

    Descripción Valor por defecto
    segmento l0 cuota de recuento de filas, nivel bajo de agua 32768

    quotaAndLimits.limitWriting.l0SegmentsRowCountProtection.highWaterLevel

    Descripción Valor por defecto
    l0 cuota de recuento de filas de segmento, nivel bajo de agua 65536

    quotaAndLimits.limitReading.forceDeny

    Descripción Valor por defecto
  • forceDeny false significa que las peticiones dql están permitidas (excepto para algunas
  • condiciones específicas, como que se haya abandonado la recolección), true significa que siempre se rechazan todas las solicitudes dql.
  • false

    quotaAndLimits.limitReading.queueProtection.nqInQueueThreshold

    Descripción Valor por defecto
  • nqInQueueThreshold indica que el sistema está bajo contrapresión para la ruta de búsqueda/consulta.
  • Si NQ en la cola de cualquier QueryNode es mayor que nqInQueueThreshold, las tasas de búsqueda&consulta se enfriarían gradualmente
  • hasta que el NQ en la cola ya no supere el nqInQueueThreshold. Pensamos en el NQ de solicitud de consulta como 1.
  • int, por defecto sin límite
  • -1

    quotaAndLimits.limitReading.queueProtection.queueLatencyThreshold

    Descripción Valor por defecto
  • queueLatencyThreshold indica que el sistema está bajo contrapresión para la ruta de búsqueda/consulta.
  • Si la latencia dql de encolado es mayor que queueLatencyThreshold, las tasas de búsqueda y consulta se enfriarían gradualmente
  • hasta que la latencia de la cola ya no supere el valor queueLatencyThreshold.
  • La latencia aquí se refiere a la latencia promediada durante un período de tiempo.
  • milisegundos, por defecto sin límite
  • -1

    quotaAndLimits.limitReading.resultProtection.maxReadResultRate

    Descripción Valor por defecto
  • maxReadResultRate indica que el sistema está sometido a una contrapresión para la ruta de búsqueda/consulta.
  • Si la tasa de resultados dql es mayor que maxReadResultRate, las tasas de búsqueda&consulta se enfriarían gradualmente
  • hasta que la tasa de resultados de lectura ya no supere maxReadResultRate.
  • MB/s, por defecto sin límite
  • -1

    quotaAndLimits.limitReading.coolOffSpeed

    Descripción Valor por defecto
  • colOffSpeed es la velocidad de enfriamiento de las tasas de búsqueda&consulta.
  • (0, 1]
  • 0.9

    Traducido porDeepLogo

    Tabla de contenidos

    Try Managed Milvus for Free

    Zilliz Cloud is hassle-free, powered by Milvus and 10x faster.

    Get Started
    Feedback

    ¿Fue útil esta página?