🚀 Coba Zilliz Cloud, Milvus yang sepenuhnya terkelola, secara gratis—rasakan performa 10x lebih cepat! Coba Sekarang>>

milvus-logo
LFAI
Beranda
  • Panduan Administrasi

Konfigurasi terkait kuota dan batas

QuotaConfig, konfigurasi kuota dan batas Milvus.

Secara default, kami mengaktifkan:

  1. Perlindungan TT;

  2. Perlindungan memori.

  3. Perlindungan kuota disk.

Anda dapat mengaktifkan:

  1. Batasan throughput DML;

  2. Batasan DDL, DQL qps/rps;

  3. Perlindungan panjang antrean/latensi DQL;

  4. Perlindungan tingkat hasil DQL;

Jika perlu, Anda juga dapat secara manual menolak permintaan RW.

quotaAndLimits.enabled

Deskripsi Nilai Default
`true` untuk mengaktifkan kuota dan batas, `false` untuk menonaktifkan. true

quotaAndLimits.quotaCenterCollectInterval

Deskripsi Nilai Default
  • quotaCenterCollectInterval adalah interval waktu yang digunakan quotaCenter
  • mengumpulkan metrik dari Proksi, klaster Kueri, dan klaster Data.
  • detik, (0 ~ 65536)
  • 3

    quotaAndLimits.limits.allocRetryTimes

    Deskripsi Nilai Default
    waktu coba ulang ketika menghapus data alokasi maju dari batas tarif gagal 15

    quotaAndLimits.limits.allocWaitInterval

    Deskripsi Nilai Default
    durasi tunggu ulang ketika menghapus data alokasi maju dari batas laju gagal, dalam milidetik 1000

    quotaAndLimits.limits.complexDeleteLimitEnable

    Deskripsi Nilai Default
    apakah kompleks menghapus data periksa ke depan dengan pembatas false

    quotaAndLimits.limits.maxCollectionNumPerDB

    Deskripsi Nilai Default
    Jumlah maksimum koleksi per basis data. 65536

    quotaAndLimits.limits.maxInsertSize

    Deskripsi Nilai Default
    ukuran maksimum dari satu permintaan penyisipan, dalam byte, -1 berarti tidak ada batas -1

    quotaAndLimits.limits.maxResourceGroupNumOfQueryNode

    Deskripsi Nilai Default
    jumlah maksimum kelompok sumber daya dari node kueri 1024

    quotaAndLimits.limits.maxGroupSize

    Deskripsi Nilai Default
    ukuran maksimum untuk satu grup tunggal saat melakukan grup pencarian dengan 10

    quotaAndLimits.ddl.enabled

    Deskripsi Nilai Default
    Apakah pelambatan permintaan DDL diaktifkan. false

    quotaAndLimits.ddl.collectionRate

    Deskripsi Nilai Default
  • Jumlah maksimum permintaan DDL terkait koleksi per detik.
  • Mengatur item ini ke 10 menunjukkan bahwa Milvus memproses tidak lebih dari 10 permintaan DDL terkait koleksi per detik, termasuk permintaan pembuatan koleksi, permintaan penghapusan koleksi, permintaan pemuatan koleksi, dan permintaan pelepasan koleksi.
  • Untuk menggunakan pengaturan ini, setel quotaAndLimits.ddl.enabled ke true pada waktu yang sama.
  • -1

    quotaAndLimits.ddl.partitionRate

    Deskripsi Nilai Default
  • Jumlah maksimum permintaan DDL terkait partisi per detik.
  • Mengatur item ini ke 10 mengindikasikan bahwa Milvus memproses tidak lebih dari 10 permintaan terkait partisi per detik, termasuk permintaan pembuatan partisi, permintaan penghapusan partisi, permintaan pemuatan partisi, dan permintaan pelepasan partisi.
  • Untuk menggunakan pengaturan ini, set quotaAndLimits.ddl.enabled ke true pada saat yang bersamaan.
  • -1

    quotaAndLimits.ddl.db.collectionRate

    Deskripsi Nilai Default
    qps dari level db, default tanpa batas, nilai untuk CreateCollection, DropCollection, LoadCollection, ReleaseCollection -1

    quotaAndLimits.ddl.db.partitionRate

    Deskripsi Nilai Default
    qps dari level db, default tanpa batas, kecepatan untuk CreatePartition, DropPartition, LoadPartition, ReleasePartition -1

    quotaAndLimits.indexRate.enabled

    Deskripsi Nilai Default
    Apakah pelambatan permintaan terkait indeks diaktifkan. false

    quotaAndLimits.indexRate.max

    Deskripsi Nilai Default
  • Jumlah maksimum permintaan terkait indeks per detik.
  • Mengatur item ini ke 10 menunjukkan bahwa Milvus memproses tidak lebih dari 10 permintaan terkait partisi per detik, termasuk permintaan pembuatan indeks dan permintaan penghapusan indeks.
  • Untuk menggunakan pengaturan ini, set quotaAndLimits.indexRate.enabled ke true pada saat yang sama.
  • -1

    quotaAndLimits.indexRate.db.max

    Deskripsi Nilai Default
    qps dari level db, default tanpa batas, laju untuk CreateIndex, DropIndex -1

    quotaAndLimits.flushRate.enabled

    Deskripsi Nilai Default
    Apakah pelambatan permintaan flush diaktifkan. true

    quotaAndLimits.flushRate.max

    Deskripsi Nilai Default
  • Jumlah maksimum permintaan flush per detik.
  • Menetapkan item ini ke 10 menunjukkan bahwa Milvus memproses tidak lebih dari 10 permintaan flush per detik.
  • Untuk menggunakan pengaturan ini, setel quotaAndLimits.flushRate.enabled ke true pada waktu yang sama.
  • -1

    quotaAndLimits.flushRate.collection.max

    Deskripsi Nilai Default
    qps, default tanpa batas, laju untuk flush pada tingkat koleksi. 0.1

    quotaAndLimits.flushRate.db.max

    Deskripsi Nilai Default
    qps dari level db, default tanpa batas, kecepatan untuk flush -1

    quotaAndLimits.compactionRate.enabled

    Deskripsi Nilai Default
    Apakah pelambatan permintaan pemadatan manual diaktifkan. false

    quotaAndLimits.compactionRate.max

    Deskripsi Nilai Default
  • Jumlah maksimum permintaan pemadatan manual per detik.
  • Mengatur item ini ke 10 menunjukkan bahwa Milvus memproses tidak lebih dari 10 permintaan pemadatan manual per detik.
  • Untuk menggunakan pengaturan ini, setel quotaAndLimits.compaction.enabled ke true pada saat yang bersamaan.
  • -1

    quotaAndLimits.compactionRate.db.max

    Deskripsi Nilai Default
    qps dari level db, default tanpa batas, laju untuk manualCompaction -1

    quotaAndLimits.dml.enabled

    Deskripsi Nilai Default
    Apakah pelambatan permintaan DML diaktifkan. false

    quotaAndLimits.dml.insertRate.max

    Deskripsi Nilai Default
  • Laju penyisipan data tertinggi per detik.
  • Mengatur item ini ke 5 menunjukkan bahwa Milvus hanya mengizinkan penyisipan data dengan kecepatan 5 MB/detik.
  • Untuk menggunakan pengaturan ini, setel quotaAndLimits.dml.enabled ke true pada saat yang sama.
  • -1

    quotaAndLimits.dml.insertRate.db.max

    Deskripsi Nilai Default
    MB/s, default tanpa batas -1

    quotaAndLimits.dml.insertRate.collection.max

    Keterangan Nilai Default
  • Laju penyisipan data tertinggi per koleksi per detik.
  • Mengatur item ini ke 5 menunjukkan bahwa Milvus hanya mengizinkan penyisipan data ke koleksi apa pun dengan kecepatan 5 MB/detik.
  • Untuk menggunakan pengaturan ini, setel quotaAndLimits.dml.enabled ke true pada saat yang sama.
  • -1

    quotaAndLimits.dml.insertRate.partition.max

    Deskripsi Nilai Default
    MB/s, default tanpa batas -1

    quotaAndLimits.dml.upsertRate.max

    Keterangan Nilai Default
    MB/detik, default tanpa batas -1

    quotaAndLimits.dml.upsertRate.db.max

    Keterangan Nilai Default
    MB/detik, default tanpa batas -1

    quotaAndLimits.dml.upsertRate.collection.max

    Keterangan Nilai Default
    MB/detik, default tanpa batas -1

    quotaAndLimits.dml.upsertRate.partition.max

    Keterangan Nilai Default
    MB/detik, default tanpa batas -1

    quotaAndLimits.dml.deleteRate.max

    Keterangan Nilai Default
  • Laju penghapusan data tertinggi per detik.
  • Mengatur item ini ke 0,1 menunjukkan bahwa Milvus hanya mengizinkan penghapusan data dengan kecepatan 0,1 MB/detik.
  • Untuk menggunakan pengaturan ini, setel quotaAndLimits.dml.enabled ke true pada waktu yang sama.
  • -1

    quotaAndLimits.dml.deleteRate.db.max

    Keterangan Nilai Default
    MB/s, default tanpa batas -1

    quotaAndLimits.dml.deleteRate.collection.max

    Keterangan Nilai Default
  • Laju penghapusan data tertinggi per detik.
  • Mengatur item ini ke 0,1 menunjukkan bahwa Milvus hanya mengizinkan penghapusan data dari koleksi apa pun dengan kecepatan 0,1 MB/detik.
  • Untuk menggunakan pengaturan ini, setel quotaAndLimits.dml.enabled ke true pada saat yang sama.
  • -1

    quotaAndLimits.dml.deleteRate.partition.max

    Deskripsi Nilai Default
    MB/s, default tanpa batas -1

    quotaAndLimits.dml.bulkLoadRate.max

    Keterangan Nilai Default
    MB/s, default tanpa batas, belum mendukung. TODO: batasi laju bulkLoad -1

    quotaAndLimits.dml.bulkLoadRate.db.max

    Deskripsi Nilai Default
    MB/s, default tanpa batas, belum mendukung. TODO: batasi db bulkLoad rate -1

    quotaAndLimits.dml.bulkLoadRate.collection.max

    Deskripsi Nilai Default
    MB/s, default tanpa batas, belum mendukung. TODO: batasi pengumpulan bulkLoad rate -1

    quotaAndLimits.dml.bulkLoadRate.partition.max

    Deskripsi Nilai Default
    MB/s, default tanpa batas, belum mendukung. TODO: batasi partisi bulkLoad rate -1

    quotaAndLimits.dql.enabled

    Deskripsi Nilai Default
    Apakah pelambatan permintaan DQL diaktifkan. false

    quotaAndLimits.dql.searchRate.max

    Deskripsi Nilai Default
  • Jumlah maksimum vektor yang akan dicari per detik.
  • Mengatur item ini ke 100 mengindikasikan bahwa Milvus hanya mengizinkan pencarian 100 vektor per detik, tidak peduli apakah 100 vektor tersebut berada dalam satu pencarian atau tersebar di beberapa pencarian.
  • Untuk menggunakan pengaturan ini, setel quotaAndLimits.dql.enabled ke true pada saat yang bersamaan.
  • -1

    quotaAndLimits.dql.searchRate.db.max

    Deskripsi Nilai Default
    vps (vektor per detik), default tanpa batas -1

    quotaAndLimits.dql.searchRate.collection.max

    Deskripsi Nilai Default
  • Jumlah maksimum vektor yang akan dicari per koleksi per detik.
  • Mengatur item ini ke 100 menunjukkan bahwa Milvus hanya mengizinkan pencarian 100 vektor per detik per koleksi, tidak peduli apakah 100 vektor ini ada dalam satu pencarian atau tersebar di beberapa pencarian.
  • Untuk menggunakan pengaturan ini, setel quotaAndLimits.dql.enabled ke true pada saat yang bersamaan.
  • -1

    quotaAndLimits.dql.searchRate.partition.max

    Deskripsi Nilai Default
    vps (vektor per detik), default tanpa batas -1

    quotaAndLimits.dql.queryRate.max

    Deskripsi Nilai Default
  • Jumlah maksimum kueri per detik.
  • Mengatur item ini ke 100 mengindikasikan bahwa Milvus hanya mengizinkan 100 kueri per detik.
  • Untuk menggunakan pengaturan ini, setel quotaAndLimits.dql.enabled ke true pada saat yang sama.
  • -1

    quotaAndLimits.dql.queryRate.db.max

    Deskripsi Nilai Default
    qps, default tanpa batas -1

    quotaAndLimits.dql.queryRate.collection.max

    Deskripsi Nilai Default
  • Jumlah maksimum kueri per koleksi per detik.
  • Mengatur item ini ke 100 mengindikasikan bahwa Milvus hanya mengizinkan 100 kueri per koleksi per detik.
  • Untuk menggunakan pengaturan ini, setel quotaAndLimits.dql.enabled ke true pada saat yang sama.
  • -1

    quotaAndLimits.dql.queryRate.partition.max

    Deskripsi Nilai Default
    qps, default tanpa batas -1

    quotaAndLimits.limitWriting.forceDeny

    Deskripsi Nilai Default
  • forceDeny false berarti permintaan dml diperbolehkan (kecuali untuk beberapa
  • kondisi tertentu, seperti memori node ke penanda air), true berarti selalu menolak semua permintaan dml.
  • false

    quotaAndLimits.limitWriting.ttProtection.maxTimeTickDelay

    Deskripsi Nilai Default
  • maxTimeTickDelay menunjukkan tekanan balik untuk Operasi DML.
  • Kecepatan DML akan berkurang sesuai dengan rasio waktu tunda detak waktu terhadap maxTimeTickDelay,
  • jika time tick delay lebih besar dari maxTimeTickDelay, semua permintaan DML akan ditolak.
  • detik
  • 300

    quotaAndLimits.limitWriting.memProtection.enabled

    Deskripsi Nilai Default
  • Ketika penggunaan memori > memoryHighWaterLevel, semua permintaan DML akan ditolak;
  • Ketika memoryLowWaterLevel < penggunaan memori < memoryHighWaterLevel, kurangi kecepatan dml;
  • Ketika penggunaan memori < memoryLowWaterLevel, tidak ada tindakan.
  • true

    quotaAndLimits.limitWriting.memProtection.dataNodeMemoryLowWaterLevel

    Deskripsi Nilai Default
    (0, 1], memoryLowWaterLevel dalam DataNode 0.85

    quotaAndLimits.limitWriting.memProtection.dataNodeMemoryHighWaterLevel

    Deskripsi Nilai Default
    (0, 1], memoryHighWaterLevel dalam DataNodes 0.95

    quotaAndLimits.limitWriting.memProtection.queryNodeMemoryLowWaterLevel

    Deskripsi Nilai Default
    (0, 1], memoryLowWaterLevel dalam QueryNodes 0.85

    quotaAndLimits.limitWriting.memProtection.queryNodeMemoryHighWaterLevel

    Deskripsi Nilai Default
    (0, 1], memoryHighWaterLevel dalam QueryNodes 0.95

    quotaAndLimits.limitWriting.growingSegmentsSizeProtection.enabled

    Deskripsi Nilai Default
  • Tidak ada tindakan yang akan dilakukan jika ukuran segmen yang tumbuh kurang dari watermark rendah.
  • Ketika ukuran segmen yang tumbuh melebihi watermark rendah, laju dml akan dikurangi,
  • tetapi laju tidak akan lebih rendah dari minRateRatio * dmlRate.
  • false

    quotaAndLimits.limitWriting.diskProtection.enabled

    Deskripsi Nilai Default
    Ketika total ukuran file penyimpanan objek lebih besar dari `diskQuota`, semua permintaan dml akan ditolak; true

    quotaAndLimits.limitWriting.diskProtection.diskQuota

    Deskripsi Nilai Default
    MB, (0, +inf), default tanpa batas -1

    quotaAndLimits.limitWriting.diskProtection.diskQuotaPerDB

    Deskripsi Nilai Default
    MB, (0, +inf), default tanpa batas -1

    quotaAndLimits.limitWriting.diskProtection.diskQuotaPerCollection

    Deskripsi Nilai Default
    MB, (0, +inf), default tanpa batas -1

    quotaAndLimits.limitWriting.diskProtection.diskQuotaPerPartition

    Deskripsi Nilai Default
    MB, (0, +inf), default tanpa batas -1

    quotaAndLimits.limitWriting.l0SegmentsRowCountProtection.enabled

    Deskripsi Nilai Default
    sakelar untuk mengaktifkan kuota jumlah baris segmen l0 salah

    quotaAndLimits.limitWriting.l0SegmentsRowCountProtection.lowWaterLevel

    Deskripsi Nilai Default
    kuota jumlah baris segmen l0, ketinggian air rendah 30000000

    quotaAndLimits.limitWriting.l0SegmentsRowCountProtection.highWaterLevel

    Deskripsi Nilai Default
    kuota jumlah baris segmen l0, ketinggian air tinggi 50000000

    quotaAndLimits.limitWriting.deleteBufferRowCountProtection.enabled

    Deskripsi Nilai Default
    sakelar untuk mengaktifkan kuota jumlah baris penyangga yang dihapus salah

    quotaAndLimits.limitWriting.deleteBufferRowCountProtection.lowWaterLevel

    Deskripsi Nilai Default
    hapus kuota jumlah baris penyangga, ketinggian air rendah 32768

    quotaAndLimits.limitWriting.deleteBufferRowCountProtection.highWaterLevel

    Deskripsi Nilai Default
    hapus kuota jumlah baris penyangga, ketinggian air tinggi 65536

    quotaAndLimits.limitWriting.deleteBufferSizeProtection.enabled

    Deskripsi Nilai Default
    beralih untuk mengaktifkan hapus kuota ukuran penyangga salah

    quotaAndLimits.limitWriting.deleteBufferSizeProtection.lowWaterLevel

    Deskripsi Nilai Default
    hapus kuota ukuran buffer, ketinggian air rendah 134217728

    quotaAndLimits.limitWriting.deleteBufferSizeProtection.highWaterLevel

    Deskripsi Nilai Default
    hapus kuota ukuran penyangga, ketinggian air tinggi 268435456

    quotaAndLimits.limitReading.forceDeny

    Deskripsi Nilai Default
  • forceDeny false berarti permintaan dql diperbolehkan (kecuali untuk beberapa
  • kondisi tertentu, seperti koleksi telah dibatalkan), true berarti selalu menolak semua permintaan dql.
  • false
    Daftar isi

    Coba Milvus yang Dikelola secara Gratis

    Zilliz Cloud bebas masalah, didukung oleh Milvus dan 10x lebih cepat.

    Mulai
    Umpan balik

    Apakah halaman ini bermanfaat?