🚀 Coba Zilliz Cloud, Milvus yang sepenuhnya terkelola, secara gratis—rasakan performa 10x lebih cepat! Coba Sekarang>>

milvus-logo
LFAI
Beranda
  • Panduan Administrasi

Konfigurasi terkait queryNode

Konfigurasi terkait queryNode, digunakan untuk menjalankan pencarian hibrida antara data vektor dan skalar.

queryNode.stats.publishInterval

Deskripsi Nilai Default
Interval saat node kueri menerbitkan informasi statistik node, termasuk status segmen, penggunaan cpu, penggunaan memori, status kesehatan, dll. Satuan: ms. 1000

queryNode.segcore.knowhereThreadPoolNumRatio

Deskripsi Nilai Default
Jumlah utas dalam kumpulan utas knowhere. Jika disk diaktifkan, ukuran pool akan dikalikan dengan knowhereThreadPoolNumRatio([1, 32]). 4

queryNode.segcore.chunkRows

Deskripsi Nilai Default
Jumlah baris yang digunakan Segcore untuk membagi segmen menjadi beberapa bagian. 128

queryNode.segcore.interimIndex.enableIndex

Deskripsi Nilai Default
  • Apakah akan membuat indeks sementara untuk segmen yang sedang berkembang dan segmen yang disegel yang belum diindeks, untuk meningkatkan kinerja pencarian.
  • Milvus pada akhirnya akan menyegel dan mengindeks semua segmen, tetapi dengan mengaktifkan ini akan mengoptimalkan kinerja pencarian untuk kueri langsung setelah penyisipan data.
  • Ini adalah nilai default untuk true, yang menunjukkan bahwa Milvus membuat indeks sementara untuk segmen yang sedang berkembang dan segmen yang disegel yang belum diindeks pada saat pencarian.
  • true

    queryNode.segcore.interimIndex.nlist

    Deskripsi Nilai Default
    indeks sementara nlist, rekomendasikan untuk mengatur sqrt(chunkRows), harus lebih kecil dari chunkRows/8 128

    queryNode.segcore.interimIndex.nprobe

    Deskripsi Nilai Default
    nprobe untuk mencari indeks kecil, berdasarkan kebutuhan akurasi Anda, harus lebih kecil dari nlist 16

    queryNode.segcore.interimIndex.memExpansionRate

    Deskripsi Nilai Default
    memori ekstra yang dibutuhkan untuk membangun indeks sementara 1.15

    queryNode.segcore.interimIndex.buildParallelRate

    Deskripsi Nilai Default
    rasio membangun indeks sementara paralel yang cocok dengan num cpu 0.5

    queryNode.segcore.multipleChunkedEnable

    Keterangan Nilai Default
    Mengaktifkan pencarian beberapa potongan true

    queryNode.segcore.knowhereScoreConsistency

    Deskripsi Nilai Default
    Mengaktifkan logika penghitungan skor konsistensi yang kuat di mana saja salah

    queryNode.loadMemoryUsageFactor

    Deskripsi Nilai Default
    Faktor pengali untuk menghitung penggunaan memori saat memuat segmen 1

    queryNode.enableDisk

    Deskripsi Nilai Default
    aktifkan querynode memuat indeks disk, dan mencari pada indeks disk false

    queryNode.cache.memoryLimit

    Deskripsi Nilai Default
    2 GB, 2 * 1024 * 1024 * 1024 2147483648

    queryNode.cache.readAheadPolicy

    Deskripsi Nilai Default
    Kebijakan baca di depan cache chunk, opsi: `normal, acak, berurutan, perlu, tidak perlu` akan membutuhkan

    queryNode.cache.warmup

    Deskripsi Nilai Default
  • opsi: asinkronisasi, sinkronisasi, nonaktifkan.
  • Menentukan kebutuhan untuk pemanasan cache chunk.
  • 1. Jika diatur ke "sync" atau "async", data vektor asli akan dimuat secara sinkron/asinkron ke dalam
  • chunk cache selama proses pemuatan. Pendekatan ini memiliki potensi untuk secara substansial mengurangi latensi kueri/pencarian
  • untuk durasi tertentu setelah pemuatan, meskipun disertai dengan peningkatan penggunaan disk secara bersamaan;
  • 2. Jika disetel ke "disable", data vektor asli hanya akan dimuat ke dalam chunk cache selama proses pencarian/query.
  • menonaktifkan

    queryNode.mmap.vectorField

    Deskripsi Nilai Default
    Mengaktifkan mmap untuk memuat data vektor false

    queryNode.mmap.vectorIndex

    Deskripsi Nilai Default
    Mengaktifkan mmap untuk memuat indeks vektor false

    queryNode.mmap.scalarField

    Deskripsi Nilai Default
    Mengaktifkan mmap untuk memuat data skalar false

    queryNode.mmap.scalarIndex

    Deskripsi Nilai Default
    Mengaktifkan mmap untuk memuat indeks skalar false

    queryNode.mmap.chunkCache

    Deskripsi Nilai Default
    Mengaktifkan mmap untuk cache chunk (pengambilan vektor mentah). true

    queryNode.mmap.growingMmapEnabled

    Deskripsi Nilai Default
  • Aktifkan pemetaan memori (mmap) untuk mengoptimalkan penanganan data mentah yang terus bertambah.
  • Dengan mengaktifkan fitur ini, overhead memori yang terkait dengan data yang baru ditambahkan atau dimodifikasi akan diminimalkan secara signifikan.
  • Namun, pengoptimalan ini mungkin akan mengorbankan sedikit penurunan latensi kueri untuk segmen data yang terpengaruh.
  • salah

    queryNode.mmap.fixedFileSizeForMmapAlloc

    Deskripsi Nilai Default
    ukuran file tmp untuk pengelola potongan mmap 1

    queryNode.mmap.maxDiskUsagePercentageForMmapAlloc

    Deskripsi Nilai Default
    persentase disk yang digunakan dalam mmap chunk manager 50

    queryNode.lazyload.enabled

    Deskripsi Nilai Default
    Mengaktifkan lazyload untuk memuat data false

    queryNode.lazyload.waitTimeout

    Deskripsi Nilai Default
    durasi batas waktu tunggu maksimum dalam milidetik sebelum mulai melakukan pencarian dan pengambilan lazyload 30000

    queryNode.lazyload.requestResourceTimeout

    Deskripsi Nilai Default
    batas waktu maksimal dalam milidetik untuk menunggu sumber daya permintaan untuk lazy load, 5 detik secara default 5000

    queryNode.lazyload.requestResourceRetryInterval

    Deskripsi Nilai Default
    interval coba ulang dalam milidetik untuk sumber daya permintaan menunggu untuk beban malas, 2 detik secara default 2000

    queryNode.lazyload.maxRetryTimes

    Deskripsi Nilai Default
    waktu percobaan ulang maksimum untuk beban malas, 1 secara default 1

    queryNode.lazyload.maxEvictPerRetry

    Deskripsi Nilai Default
    jumlah pengusiran maksimal untuk beban malas, 1 secara default 1

    queryNode.indexOffsetCacheEnabled

    Deskripsi Nilai Default
    aktifkan cache offset indeks untuk beberapa indeks skalar, sekarang hanya untuk indeks bitmap, aktifkan param ini dapat meningkatkan kinerja untuk mengambil data mentah dari indeks false

    queryNode.scheduler.maxReadConcurrentRatio

    Deskripsi Nilai Default
  • maxReadConcurrentRatio adalah rasio konkurensi tugas baca (tugas pencarian dan tugas kueri).
  • Konkurensi baca maksimum akan menjadi nilai dari hardware.GetCPUNum * maxReadConcurrentRatio.
  • Defaultnya adalah 2.0, yang berarti konkurensi baca maksimum adalah nilai dari hardware.GetCPUNum * 2.
  • Konkurensi baca maksimum harus lebih besar atau sama dengan 1, dan kurang dari atau sama dengan hardware.GetCPUNum * 100.
  • (0, 100]
  • 1

    queryNode.scheduler.cpuRatio

    Deskripsi Nilai Default
    rasio yang digunakan untuk memperkirakan penggunaan cpu tugas baca. 10

    queryNode.scheduler.scheduleReadPolicy.name

    Deskripsi Nilai Default
  • fifo Antrian FIFO yang mendukung jadwal.
  • user-task-polling:
  • Tugas pengguna akan disurvei satu per satu dan dijadwalkan.
  • Penjadwalan adil berdasarkan perincian tugas.
  • Kebijakan ini didasarkan pada nama pengguna untuk otentikasi.
  • Dan nama pengguna yang kosong dianggap sebagai pengguna yang sama.
  • Jika tidak ada banyak pengguna, kebijakan akan berubah menjadi FIFO"
  • FIFO

    queryNode.scheduler.scheduleReadPolicy.taskQueueExpire

    Deskripsi Nilai Default
    Mengontrol berapa lama (dalam detik) antrean ditahan sejak antrean kosong 60

    queryNode.scheduler.scheduleReadPolicy.enableCrossUserGrouping

    Deskripsi Nilai Default
    Aktifkan pengelompokan pengguna silang saat menggunakan kebijakan pengumpulan tugas pengguna. (Nonaktifkan jika tugas pengguna tidak dapat digabungkan satu sama lain) false

    queryNode.scheduler.scheduleReadPolicy.maxPendingTaskPerUser

    Deskripsi Nilai Default
    Tugas tertunda maksimum per pengguna dalam penjadwal 1024

    queryNode.levelZeroForwardPolicy

    Deskripsi Nilai Default
    kebijakan penerusan penghapusan tingkat nol delegator, opsi yang memungkinkan ["FilterByBF", "RemoteLoad"] FilterByBF

    queryNode.streamingDeltaForwardPolicy

    Deskripsi Nilai Default
    kebijakan penerusan penghapusan streaming delegator, opsi yang memungkinkan ["FilterByBF", "Direct"] FilterByBF

    queryNode.dataSync.flowGraph.maxQueueLength

    Deskripsi Nilai Default
    Ukuran maksimum cache antrean tugas dalam grafik aliran di simpul kueri. 16

    queryNode.dataSync.flowGraph.maxParallelism

    Deskripsi Nilai Default
    Jumlah maksimum tugas yang dieksekusi secara paralel dalam diagram alir 1024

    queryNode.enableSegmentPrune

    Deskripsi Nilai Default
    gunakan statistik partisi untuk memangkas data dalam pencarian/kueri pada delegator pecahan false

    queryNode.queryStreamBatchSize

    Deskripsi Nilai Default
    kembalikan ukuran batch minimum dari kueri aliran 4194304

    queryNode.queryStreamMaxBatchSize

    Deskripsi Nilai Default
    kembalikan ukuran batch maksimal dari kueri aliran 134217728

    queryNode.bloomFilterApplyParallelFactor

    Deskripsi Nilai Default
    faktor paralel kapan harus menerapkan pk ke filter bloom, default ke 4*CPU_CORE_NUM 4

    queryNode.workerPooling.size

    Deskripsi Nilai Default
    ukuran untuk kumpulan klien querynode pekerja 10

    queryNode.ip

    Deskripsi Nilai Default
    Alamat TCP/IP dari queryNode. Jika tidak ditentukan, gunakan alamat pertama yang dapat di-unicast

    queryNode.port

    Deskripsi Nilai Default
    Port TCP dari queryNode 21123

    queryNode.grpc.serverMaxSendSize

    Deskripsi Nilai Default
    Ukuran maksimum setiap permintaan RPC yang dapat dikirim oleh queryNode, satuan: byte 536870912

    queryNode.grpc.serverMaxRecvSize

    Deskripsi Nilai Default
    Ukuran maksimum setiap permintaan RPC yang dapat diterima oleh queryNode, satuan: byte 268435456

    queryNode.grpc.clientMaxSendSize

    Deskripsi Nilai Default
    Ukuran maksimum setiap permintaan RPC yang dapat dikirim oleh klien pada queryNode, satuan: byte 268435456

    queryNode.grpc.clientMaxRecvSize

    Deskripsi Nilai Default
    Ukuran maksimum setiap permintaan RPC yang dapat diterima oleh klien di queryNode, satuan: byte 536870912
    Daftar isi

    Coba Milvus yang Dikelola secara Gratis

    Zilliz Cloud bebas masalah, didukung oleh Milvus dan 10x lebih cepat.

    Mulai
    Umpan balik

    Apakah halaman ini bermanfaat?