Konfigurasi terkait queryNode, digunakan untuk menjalankan pencarian hibrida antara data vektor dan skalar.
Deskripsi |
Nilai Default |
Interval saat node kueri menerbitkan informasi statistik node, termasuk status segmen, penggunaan cpu, penggunaan memori, status kesehatan, dll. Satuan: ms. |
1000 |
Deskripsi |
Nilai Default |
Jumlah utas dalam kumpulan utas knowhere. Jika disk diaktifkan, ukuran pool akan dikalikan dengan knowhereThreadPoolNumRatio([1, 32]). |
4 |
Deskripsi |
Nilai Default |
Jumlah baris yang digunakan Segcore untuk membagi segmen menjadi beberapa bagian. |
128 |
Deskripsi |
Nilai Default |
Apakah akan membuat indeks sementara untuk segmen yang sedang berkembang dan segmen yang disegel yang belum diindeks, untuk meningkatkan kinerja pencarian.
Milvus pada akhirnya akan menyegel dan mengindeks semua segmen, tetapi dengan mengaktifkan ini akan mengoptimalkan kinerja pencarian untuk kueri langsung setelah penyisipan data.
Ini adalah nilai default untuk true, yang menunjukkan bahwa Milvus membuat indeks sementara untuk segmen yang sedang berkembang dan segmen yang disegel yang belum diindeks pada saat pencarian. |
true |
Deskripsi |
Nilai Default |
indeks sementara nlist, rekomendasikan untuk mengatur sqrt(chunkRows), harus lebih kecil dari chunkRows/8 |
128 |
Deskripsi |
Nilai Default |
nprobe untuk mencari indeks kecil, berdasarkan kebutuhan akurasi Anda, harus lebih kecil dari nlist |
16 |
Deskripsi |
Nilai Default |
memori ekstra yang dibutuhkan untuk membangun indeks sementara |
1.15 |
Deskripsi |
Nilai Default |
rasio membangun indeks sementara paralel yang cocok dengan num cpu |
0.5 |
Keterangan |
Nilai Default |
Mengaktifkan pencarian beberapa potongan |
true |
Deskripsi |
Nilai Default |
Mengaktifkan logika penghitungan skor konsistensi yang kuat di mana saja |
salah |
Deskripsi |
Nilai Default |
Faktor pengali untuk menghitung penggunaan memori saat memuat segmen |
1 |
Deskripsi |
Nilai Default |
aktifkan querynode memuat indeks disk, dan mencari pada indeks disk |
false |
Deskripsi |
Nilai Default |
2 GB, 2 * 1024 * 1024 * 1024 |
2147483648 |
Deskripsi |
Nilai Default |
Kebijakan baca di depan cache chunk, opsi: `normal, acak, berurutan, perlu, tidak perlu` |
akan membutuhkan |
Deskripsi |
Nilai Default |
opsi: asinkronisasi, sinkronisasi, nonaktifkan.
Menentukan kebutuhan untuk pemanasan cache chunk.
1. Jika diatur ke "sync" atau "async", data vektor asli akan dimuat secara sinkron/asinkron ke dalam
chunk cache selama proses pemuatan. Pendekatan ini memiliki potensi untuk secara substansial mengurangi latensi kueri/pencarian
untuk durasi tertentu setelah pemuatan, meskipun disertai dengan peningkatan penggunaan disk secara bersamaan;
2. Jika disetel ke "disable", data vektor asli hanya akan dimuat ke dalam chunk cache selama proses pencarian/query. |
menonaktifkan |
Deskripsi |
Nilai Default |
Mengaktifkan mmap untuk memuat data vektor |
false |
Deskripsi |
Nilai Default |
Mengaktifkan mmap untuk memuat indeks vektor |
false |
Deskripsi |
Nilai Default |
Mengaktifkan mmap untuk memuat data skalar |
false |
Deskripsi |
Nilai Default |
Mengaktifkan mmap untuk memuat indeks skalar |
false |
Deskripsi |
Nilai Default |
Mengaktifkan mmap untuk cache chunk (pengambilan vektor mentah). |
true |
Deskripsi |
Nilai Default |
Aktifkan pemetaan memori (mmap) untuk mengoptimalkan penanganan data mentah yang terus bertambah.
Dengan mengaktifkan fitur ini, overhead memori yang terkait dengan data yang baru ditambahkan atau dimodifikasi akan diminimalkan secara signifikan.
Namun, pengoptimalan ini mungkin akan mengorbankan sedikit penurunan latensi kueri untuk segmen data yang terpengaruh. |
salah |
Deskripsi |
Nilai Default |
Mengaktifkan lazyload untuk memuat data |
false |
Deskripsi |
Nilai Default |
durasi batas waktu tunggu maksimum dalam milidetik sebelum mulai melakukan pencarian dan pengambilan lazyload |
30000 |
Deskripsi |
Nilai Default |
batas waktu maksimal dalam milidetik untuk menunggu sumber daya permintaan untuk lazy load, 5 detik secara default |
5000 |
Deskripsi |
Nilai Default |
interval coba ulang dalam milidetik untuk sumber daya permintaan menunggu untuk beban malas, 2 detik secara default |
2000 |
Deskripsi |
Nilai Default |
waktu percobaan ulang maksimum untuk beban malas, 1 secara default |
1 |
Deskripsi |
Nilai Default |
jumlah pengusiran maksimal untuk beban malas, 1 secara default |
1 |
Deskripsi |
Nilai Default |
aktifkan cache offset indeks untuk beberapa indeks skalar, sekarang hanya untuk indeks bitmap, aktifkan param ini dapat meningkatkan kinerja untuk mengambil data mentah dari indeks |
false |
Deskripsi |
Nilai Default |
maxReadConcurrentRatio adalah rasio konkurensi tugas baca (tugas pencarian dan tugas kueri).
Konkurensi baca maksimum akan menjadi nilai dari hardware.GetCPUNum * maxReadConcurrentRatio.
Defaultnya adalah 2.0, yang berarti konkurensi baca maksimum adalah nilai dari hardware.GetCPUNum * 2.
Konkurensi baca maksimum harus lebih besar atau sama dengan 1, dan kurang dari atau sama dengan hardware.GetCPUNum * 100.
(0, 100] |
1 |
Deskripsi |
Nilai Default |
rasio yang digunakan untuk memperkirakan penggunaan cpu tugas baca. |
10 |
Deskripsi |
Nilai Default |
fifo Antrian FIFO yang mendukung jadwal.
user-task-polling:
Tugas pengguna akan disurvei satu per satu dan dijadwalkan.
Penjadwalan adil berdasarkan perincian tugas.
Kebijakan ini didasarkan pada nama pengguna untuk otentikasi.
Dan nama pengguna yang kosong dianggap sebagai pengguna yang sama.
Jika tidak ada banyak pengguna, kebijakan akan berubah menjadi FIFO" |
FIFO |
Deskripsi |
Nilai Default |
Mengontrol berapa lama (dalam detik) antrean ditahan sejak antrean kosong |
60 |
Deskripsi |
Nilai Default |
Aktifkan pengelompokan pengguna silang saat menggunakan kebijakan pengumpulan tugas pengguna. (Nonaktifkan jika tugas pengguna tidak dapat digabungkan satu sama lain) |
false |
Deskripsi |
Nilai Default |
Tugas tertunda maksimum per pengguna dalam penjadwal |
1024 |
Deskripsi |
Nilai Default |
kebijakan penerusan penghapusan tingkat nol delegator, opsi yang memungkinkan ["FilterByBF", "RemoteLoad"] |
FilterByBF |
Deskripsi |
Nilai Default |
kebijakan penerusan penghapusan streaming delegator, opsi yang memungkinkan ["FilterByBF", "Direct"] |
FilterByBF |
Deskripsi |
Nilai Default |
Ukuran maksimum cache antrean tugas dalam grafik aliran di simpul kueri. |
16 |
Deskripsi |
Nilai Default |
Jumlah maksimum tugas yang dieksekusi secara paralel dalam diagram alir |
1024 |
Deskripsi |
Nilai Default |
gunakan statistik partisi untuk memangkas data dalam pencarian/kueri pada delegator pecahan |
false |
Deskripsi |
Nilai Default |
kembalikan ukuran batch minimum dari kueri aliran |
4194304 |
Deskripsi |
Nilai Default |
kembalikan ukuran batch maksimal dari kueri aliran |
134217728 |
Deskripsi |
Nilai Default |
faktor paralel kapan harus menerapkan pk ke filter bloom, default ke 4*CPU_CORE_NUM |
4 |
Deskripsi |
Nilai Default |
ukuran untuk kumpulan klien querynode pekerja |
10 |
Deskripsi |
Nilai Default |
Alamat TCP/IP dari queryNode. Jika tidak ditentukan, gunakan alamat pertama yang dapat di-unicast |
|
Deskripsi |
Nilai Default |
Port TCP dari queryNode |
21123 |
Deskripsi |
Nilai Default |
Ukuran maksimum setiap permintaan RPC yang dapat dikirim oleh queryNode, satuan: byte |
536870912 |
Deskripsi |
Nilai Default |
Ukuran maksimum setiap permintaan RPC yang dapat diterima oleh queryNode, satuan: byte |
268435456 |
Deskripsi |
Nilai Default |
Ukuran maksimum setiap permintaan RPC yang dapat dikirim oleh klien pada queryNode, satuan: byte |
268435456 |
Deskripsi |
Nilai Default |
Ukuran maksimum setiap permintaan RPC yang dapat diterima oleh klien di queryNode, satuan: byte |
536870912 |