🚀 Try Zilliz Cloud, the fully managed Milvus, for free—experience 10x faster performance! Try Now>>

milvus-logo
LFAI
홈페이지
  • 관리 가이드

쿼타 및 제한 관련 구성

밀버스 쿼터 및 제한을 구성하는 QuotaConfig.

기본적으로 활성화되어 있습니다:

  1. TT 보호;

  2. 메모리 보호.

  3. 디스크 할당량 보호.

활성화할 수 있습니다:

  1. DML 처리량 제한;

  2. DDL, DQL qps/rps 제한;

  3. DQL 대기열 길이/대기 시간 보호;

  4. DQL 결과 속도 보호;

필요한 경우 수동으로 RW 요청을 강제로 거부할 수도 있습니다.

quotaAndLimits.enabled

설명 기본값
할당량 및 제한을 활성화하려면 'true', 비활성화하려면 'false'입니다. true

quotaAndLimits.quotaCenterCollectInterval

설명 기본값
  • 쿼터 센터 수집 간격은 쿼터 센터가
  • 가 프록시, 쿼리 클러스터 및 데이터 클러스터에서 메트릭을 수집하는 시간 간격입니다.
  • 초, (0 ~ 65536)
  • 3

    quotaAndLimits.limits.allocRetryTimes

    설명 기본값
    속도 제한에서 순방향 데이터 할당 삭제 실패 시 재시도 시간 15

    quotaAndLimits.limits.allocWaitInterval

    설명 기본값
    순방향 데이터 전송률 할당 삭제 실패 시 재시도 대기 기간(밀리초) 1000

    quotaAndLimits.limits.complexDeleteLimitEnable

    설명 기본값
    리미터에 의한 복합 삭제 정방향 데이터 확인 여부 false

    quotaAndLimits.limits.maxCollectionNumPerDB

    설명 기본값
    데이터베이스당 최대 컬렉션 수입니다. 65536

    quotaAndLimits.limits.maxInsertSize

    설명 기본값
    단일 삽입 요청의 최대 크기(바이트 단위), -1은 제한이 없음을 의미합니다. -1

    quotaAndLimits.limits.maxResourceGroupNumOfQueryNode

    설명 기본값
    쿼리 노드의 최대 리소스 그룹 수 1024

    quotaAndLimits.limits.maxGroupSize

    설명 기본값
    검색 그룹을 기준으로 할 때 하나의 단일 그룹에 대한 최대 크기 10

    quotaAndLimits.ddl.enabled

    설명 기본값
    DDL 요청 스로틀링을 사용할지 여부입니다. false

    quotaAndLimits.ddl.collectionRate

    설명 기본값
  • 초당 최대 컬렉션 관련 DDL 요청 수입니다.
  • 이 항목을 10으로 설정하면 Milvus가 컬렉션 생성 요청, 컬렉션 삭제 요청, 컬렉션 로드 요청, 컬렉션 릴리스 요청을 포함하여 초당 컬렉션 관련 DDL 요청을 10개 이하로 처리함을 나타냅니다.
  • 이 설정을 사용하려면 quotaAndLimits.ddl.enabled를 동시에 true로 설정하세요.
  • -1

    quotaAndLimits.ddl.partitionRate

    설명 기본값
  • 초당 파티션 관련 DDL 요청의 최대 수입니다.
  • 이 항목을 10으로 설정하면 Milvus는 파티션 생성 요청, 파티션 삭제 요청, 파티션 로드 요청, 파티션 해제 요청을 포함하여 초당 10건 이하의 파티션 관련 요청을 처리합니다.
  • 이 설정을 사용하려면 quotaAndLimits.ddl.enabled를 동시에 true로 설정하세요.
  • -1

    quotaAndLimits.ddl.db.collectionRate

    설명 기본값
    DB 수준의 쿼터, 기본값 제한 없음, CreateCollection, DropCollection, LoadCollection, ReleaseCollection의 속도 -1

    quotaAndLimits.ddl.db.partitionRate

    설명 기본값
    db 수준의 qps, 기본값은 제한 없음, CreatePartition, DropPartition, LoadPartition, ReleasePartition의 속도 -1

    quotaAndLimits.indexRate.enabled

    설명 기본값
    인덱스 관련 요청 스로틀링을 사용할지 여부입니다. false

    quotaAndLimits.indexRate.max

    설명 기본값
  • 초당 최대 인덱스 관련 요청 수입니다.
  • 이 항목을 10으로 설정하면 Milvus가 인덱스 생성 요청 및 인덱스 삭제 요청을 포함하여 초당 10개를 초과하지 않는 파티션 관련 요청을 처리한다는 의미입니다.
  • 이 설정을 사용하려면 quotaAndLimits.indexRate.enabled를 동시에 true로 설정하세요.
  • -1

    quotaAndLimits.indexRate.db.max

    설명 기본값
    DB 수준의 쿼터, 기본값은 제한 없음, CreateIndex, DropIndex의 속도 -1

    quotaAndLimits.flushRate.enabled

    설명 기본값
    플러시 요청 스로틀링을 사용할지 여부입니다. true

    quotaAndLimits.flushRate.max

    설명 기본값
  • 초당 최대 플러시 요청 수입니다.
  • 이 항목을 10으로 설정하면 Milvus가 초당 10건 이하의 플러시 요청을 처리합니다.
  • 이 설정을 사용하려면 quotaAndLimits.flushRate.enabled를 동시에 true로 설정하세요.
  • -1

    quotaAndLimits.flushRate.collection.max

    설명 기본값
    쿼터, 기본값 제한 없음, 수집 수준에서 플러시 속도. 0.1

    quotaAndLimits.flushRate.db.max

    설명 기본값
    DB 수준의 QPS, 기본값 제한 없음, 플러시 속도 -1

    quotaAndLimits.compactionRate.enabled

    설명 기본값
    수동 압축 요청 스로틀링을 사용할지 여부입니다. false

    quotaAndLimits.compactionRate.max

    설명 기본값
  • 초당 최대 수동 압축 요청 수입니다.
  • 이 항목을 10으로 설정하면 Milvus가 초당 수동 압축 요청을 10건 이하로 처리합니다.
  • 이 설정을 사용하려면 quotaAndLimits.compaction.enabled를 동시에 true로 설정하세요.
  • -1

    quotaAndLimits.compactionRate.db.max

    설명 기본값
    DB 수준의 쿼터, 기본값은 제한 없음, 수동 압축의 속도 -1

    quotaAndLimits.dml.enabled

    설명 기본값
    DML 요청 스로틀링 사용 여부입니다. false

    quotaAndLimits.dml.insertRate.max

    설명 기본값
  • 초당 최고 데이터 삽입 속도.
  • 이 항목을 5로 설정하면 Milvus에서 5MB/s의 속도로만 데이터 삽입을 허용합니다.
  • 이 설정을 사용하려면 quotaAndLimits.dml.enabled를 동시에 true로 설정하세요.
  • -1

    quotaAndLimits.dml.insertRate.db.max

    설명 기본값
    MB/s, 기본값 제한 없음 -1

    quotaAndLimits.dml.insertRate.collection.max

    설명 기본값
  • 초당 컬렉션당 최고 데이터 삽입 속도입니다.
  • 이 항목을 5로 설정하면 Milvus가 모든 컬렉션에 5MB/s의 속도로만 데이터 삽입을 허용합니다.
  • 이 설정을 사용하려면 quotaAndLimits.dml.enabled를 동시에 true로 설정하세요.
  • -1

    quotaAndLimits.dml.insertRate.partition.max

    설명 기본값
    MB/s, 기본값 제한 없음 -1

    quotaAndLimits.dml.upsertRate.max

    설명 기본값
    MB/s, 기본값 제한 없음 -1

    quotaAndLimits.dml.upsertRate.db.max

    설명 기본값
    MB/s, 기본값 제한 없음 -1

    quotaAndLimits.dml.upsertRate.collection.max

    설명 기본값
    MB/s, 기본값 제한 없음 -1

    quotaAndLimits.dml.upsertRate.partition.max

    설명 기본값
    MB/s, 기본값 제한 없음 -1

    quotaAndLimits.dml.deleteRate.max

    설명 기본값
  • 초당 최고 데이터 삭제 속도입니다.
  • 이 항목을 0.1로 설정하면 Milvus에서 0.1MB/s의 속도로만 데이터 삭제를 허용합니다.
  • 이 설정을 사용하려면 quotaAndLimits.dml.enabled를 동시에 true로 설정하세요.
  • -1

    quotaAndLimits.dml.deleteRate.db.max

    설명 기본값
    MB/s, 기본값 제한 없음 -1

    quotaAndLimits.dml.deleteRate.collection.max

    설명 기본값
  • 초당 최고 데이터 삭제 속도입니다.
  • 이 항목을 0.1로 설정하면 Milvus가 모든 컬렉션에서 0.1MB/s의 속도로만 데이터 삭제를 허용합니다.
  • 이 설정을 사용하려면 quotaAndLimits.dml.enabled를 동시에 true로 설정하세요.
  • -1

    quotaAndLimits.dml.deleteRate.partition.max

    설명 기본값
    MB/s, 기본값 제한 없음 -1

    quotaAndLimits.dml.bulkLoadRate.max

    설명 기본값
    MB/s, 기본값 제한 없음, 아직 지원되지 않음. 할 일: 벌크로드 속도 제한 -1

    quotaAndLimits.dml.bulkLoadRate.db.max

    설명 기본값
    MB/s, 기본값은 제한 없음, 아직 지원되지 않음. TODO: db bulkLoad 속도 제한 -1

    quotaAndLimits.dml.bulkLoadRate.collection.max

    설명 기본값
    MB/s, 기본값은 제한 없음, 아직 지원되지 않음. 할 일: 수집 벌크로드 속도 제한 -1

    quotaAndLimits.dml.bulkLoadRate.partition.max

    설명 기본값
    MB/s, 기본값은 제한 없음, 아직 지원되지 않음. 할 일: 파티션 벌크로드 속도 제한 -1

    quotaAndLimits.dql.enabled

    설명 기본값
    DQL 요청 스로틀링 사용 여부입니다. false

    quotaAndLimits.dql.searchRate.max

    설명 기본값
  • 초당 검색할 수 있는 최대 벡터 수입니다.
  • 이 항목을 100으로 설정하면 이 100개의 벡터가 모두 한 검색에 포함되거나 여러 검색에 흩어져 있든 상관없이 Milvus에서 초당 100개의 벡터만 검색할 수 있습니다.
  • 이 설정을 사용하려면 quotaAndLimits.dql.enabled를 동시에 true로 설정하세요.
  • -1

    quotaAndLimits.dql.searchRate.db.max

    설명 기본값
    VPS(초당 벡터 수), 기본값 제한 없음 -1

    quotaAndLimits.dql.searchRate.collection.max

    설명 기본값
  • 컬렉션당 초당 검색할 수 있는 최대 벡터 수입니다.
  • 이 항목을 100으로 설정하면 이 100개의 벡터가 모두 한 검색에 포함되든 여러 검색에 흩어져 있든 상관없이 Milvus가 컬렉션당 초당 100개의 벡터만 검색하도록 허용합니다.
  • 이 설정을 사용하려면 quotaAndLimits.dql.enabled를 동시에 true로 설정하세요.
  • -1

    quotaAndLimits.dql.searchRate.partition.max

    설명 기본값
    VPS(초당 벡터 수), 기본값 제한 없음 -1

    quotaAndLimits.dql.queryRate.max

    설명 기본값
  • 초당 최대 쿼리 수입니다.
  • 이 항목을 100으로 설정하면 Milvus에서 초당 100개의 쿼리만 허용합니다.
  • 이 설정을 사용하려면 quotaAndLimits.dql.enabled를 동시에 true로 설정하세요.
  • -1

    quotaAndLimits.dql.queryRate.db.max

    설명 기본값
    쿼터, 기본값 제한 없음 -1

    quotaAndLimits.dql.queryRate.collection.max

    설명 기본값
  • 초당 컬렉션당 최대 쿼리 수입니다.
  • 이 항목을 100으로 설정하면 Milvus에서 컬렉션당 초당 100개의 쿼리만 허용합니다.
  • 이 설정을 사용하려면 quotaAndLimits.dql.enabled를 동시에 true로 설정하세요.
  • -1

    quotaAndLimits.dql.queryRate.partition.max

    설명 기본값
    쿼터, 기본값 제한 없음 -1

    quotaAndLimits.limitWriting.forceDeny

    설명 기본값
  • forceDeny false는 dml 요청이 허용됨을 의미하며(워터 마커에 대한 노드의 메모리와 같은 일부
  • 특정 조건 제외), true는 항상 모든 dml 요청을 거부함을 의미합니다.
  • false

    quotaAndLimits.limitWriting.ttProtection.maxTimeTickDelay

    설명 기본값
  • 최대 타임 틱 지연은 DML 작업의 역압을 나타냅니다.
  • 시간 틱 지연과 최대 시간 틱 지연의 비율에 따라 DML 속도가 감소합니다,
  • 시간 틱 지연이 최대 시간 틱 지연보다 크면 모든 DML 요청이 거부됩니다.
  • 300

    quotaAndLimits.limitWriting.memProtection.enabled

    설명 기본값
  • 메모리 사용량 > memoryHighWaterLevel일 경우 모든 DML 요청이 거부됩니다;
  • memoryLowWaterLevel < 메모리 사용량 < memoryHighWaterLevel일 경우, dml 속도를 줄입니다;
  • 메모리 사용량이 memoryLowWaterLevel <이면 아무 조치도 취하지 않습니다.
  • true

    quotaAndLimits.limitWriting.memProtection.dataNodeMemoryLowWaterLevel

    설명 기본값
    (0, 1], 데이터 노드의 memoryLowWaterLevel 0.85

    quotaAndLimits.limitWriting.memProtection.dataNodeMemoryHighWaterLevel

    설명 기본값
    (0, 1], DataNodes의 memoryHighWaterLevel 0.95

    quotaAndLimits.limitWriting.memProtection.queryNodeMemoryLowWaterLevel

    설명 기본값
    (0, 1], QueryNodes의 memoryLowWaterLevel 0.85

    quotaAndLimits.limitWriting.memProtection.queryNodeMemoryHighWaterLevel

    설명 기본값
    (0, 1], QueryNodes의 memoryHighWaterLevel 0.95

    quotaAndLimits.limitWriting.growingSegmentsSizeProtection.enabled

    설명 기본값
  • 증가하는 세그먼트 크기가 낮은 워터마크보다 작으면 아무 조치도 취하지 않습니다.
  • 증가하는 세그먼트 크기가 낮은 워터마크를 초과하면 dml 속도가 감소합니다,
  • 하지만 이 비율은 최소 비율 * dml 비율보다 낮지 않습니다.
  • false

    quotaAndLimits.limitWriting.diskProtection.enabled

    설명 기본값
    오브젝트 스토리지의 총 파일 크기가 `디스크 쿼터`보다 크면 모든 dml 요청이 거부됩니다; true

    quotaAndLimits.limitWriting.diskProtection.diskQuota

    설명 기본값
    MB, (0, +inf), 기본값 제한 없음 -1

    quotaAndLimits.limitWriting.diskProtection.diskQuotaPerDB

    설명 기본값
    MB, (0, +inf), 기본값 제한 없음 -1

    quotaAndLimits.limitWriting.diskProtection.diskQuotaPerCollection

    설명 기본값
    MB, (0, +inf), 기본값 제한 없음 -1

    quotaAndLimits.limitWriting.diskProtection.diskQuotaPerPartition

    설명 기본값
    MB, (0, +inf), 기본값 제한 없음 -1

    quotaAndLimits.limitWriting.l0SegmentsRowCountProtection.enabled

    설명 기본값
    L0 세그먼트 행 수 할당량 활성화 스위치 false

    quotaAndLimits.limitWriting.l0SegmentsRowCountProtection.lowWaterLevel

    설명 기본값
    L0 세그먼트 행 수 할당량, 저수위 30000000

    quotaAndLimits.limitWriting.l0SegmentsRowCountProtection.highWaterLevel

    설명 기본값
    L0 세그먼트 행 수 할당량, 높은 수위 50000000

    quotaAndLimits.limitWriting.deleteBufferRowCountProtection.enabled

    설명 기본값
    버퍼 행 수 할당량 삭제를 사용하도록 전환합니다. false

    quotaAndLimits.limitWriting.deleteBufferRowCountProtection.lowWaterLevel

    설명 기본값
    버퍼 행 수 할당량 삭제, 낮은 수위 32768

    quotaAndLimits.limitWriting.deleteBufferRowCountProtection.highWaterLevel

    설명 기본값
    버퍼 행 수 할당량 삭제, 높은 수위 65536

    quotaAndLimits.limitWriting.deleteBufferSizeProtection.enabled

    설명 기본값
    삭제 버퍼 크기 할당량을 사용하도록 전환합니다. false

    quotaAndLimits.limitWriting.deleteBufferSizeProtection.lowWaterLevel

    설명 기본값
    버퍼 크기 할당량 삭제, 낮은 수위 134217728

    quotaAndLimits.limitWriting.deleteBufferSizeProtection.highWaterLevel

    설명 기본값
    버퍼 크기 할당량 삭제, 높은 수위 268435456

    quotaAndLimits.limitReading.forceDeny

    설명 기본값
  • forceDeny false는 dql 요청이 허용됨을 의미하며(일부 특정 조건 제외
  • 특정 조건 제외), true는 항상 모든 dql 요청을 거부함을 의미합니다.
  • false

    번역DeepL

    목차 목록

    Try Managed Milvus for Free

    Zilliz Cloud is hassle-free, powered by Milvus and 10x faster.

    Get Started
    피드백

    이 페이지가 도움이 되었나요?