Mengungkap Milvus 2.4: Pencarian Multi-vektor, Vektor Jarang, Indeks CAGRA, dan Banyak Lagi!
Kami dengan bangga mengumumkan peluncuran Milvus 2.4, sebuah kemajuan besar dalam meningkatkan kemampuan pencarian untuk kumpulan data berskala besar. Rilis terbaru ini menambahkan fitur-fitur baru, seperti dukungan untuk indeks CAGRA berbasis GPU, dukungan beta untuk penyematan yang jarang, pencarian grup, dan berbagai peningkatan lainnya dalam kemampuan pencarian. Perkembangan ini memperkuat komitmen kami kepada komunitas dengan menawarkan kepada para pengembang seperti Anda, sebuah alat yang ampuh dan efisien untuk menangani dan melakukan kueri data vektor. Mari kita bahas manfaat utama Milvus 2.4.
Pencarian Multi-vektor yang Diaktifkan untuk Pencarian Multimodal yang Disederhanakan
Milvus 2.4 menyediakan kemampuan pencarian multivektor, yang memungkinkan pencarian dan pengurutan ulang berbagai jenis vektor secara simultan dalam sistem Milvus yang sama. Fitur ini menyederhanakan pencarian multimodal, secara signifikan meningkatkan tingkat penarikan dan memungkinkan pengembang untuk dengan mudah mengelola aplikasi AI yang rumit dengan berbagai tipe data. Selain itu, fungsi ini menyederhanakan integrasi dan penyempurnaan model pemeringkatan ulang khusus, membantu dalam pembuatan fungsi pencarian lanjutan seperti sistem pemberi rekomendasi yang tepat yang memanfaatkan wawasan dari data multidimensi.
Cara Kerja Fitur Pencarian Milti-Vektor
Dukungan multivektor di Milvus memiliki dua komponen:
Kemampuan untuk menyimpan/menghasilkan beberapa vektor untuk satu entitas dalam satu koleksi, yang merupakan cara yang lebih alami untuk mengatur data
Kemampuan untuk membangun/mengoptimalkan algoritma perangkingan ulang dengan memanfaatkan algoritma perangkingan ulang yang sudah ada di Milvus
Selain menjadi fitur yang banyak diminta, kami membangun kemampuan ini karena industri ini bergerak menuju model multimodal dengan dirilisnya GPT-4 dan Claude 3. Perangkingan ulang adalah teknik yang umum digunakan untuk lebih meningkatkan kinerja kueri dalam penelusuran. Kami bertujuan untuk memudahkan para pengembang dalam membangun dan mengoptimalkan reranker mereka dalam ekosistem Milvus.
Dukungan Pengelompokan Pencarian untuk Meningkatkan Efisiensi Komputasi
Grouping Search adalah fitur lain yang sering diminta yang kami tambahkan ke Milvus 2.4. Fitur ini mengintegrasikan operasi per kelompok yang dirancang untuk field bertipe BOOL, INT, atau VARCHAR, yang mengisi kesenjangan efisiensi yang krusial dalam mengeksekusi kueri pengelompokan berskala besar.
Secara tradisional, pengembang mengandalkan pencarian Top-K yang ekstensif diikuti dengan pasca-pemrosesan manual untuk menyaring hasil spesifik grup, metode yang intensif komputasi dan kode-berat. Grouping Search menyempurnakan proses ini dengan secara efisien menghubungkan hasil kueri ke pengidentifikasi kelompok agregat seperti nama dokumen atau video, merampingkan penanganan entitas tersegmentasi dalam kumpulan data yang lebih besar.
Milvus membedakan Grouping Search-nya dengan implementasi berbasis iterator, menawarkan peningkatan yang nyata dalam efisiensi komputasi dibandingkan teknologi serupa. Pilihan ini memastikan skalabilitas kinerja yang unggul, terutama di lingkungan produksi yang mengutamakan optimalisasi sumber daya komputasi. Dengan mengurangi penelusuran data dan overhead komputasi, Milvus mendukung pemrosesan kueri yang lebih efisien, secara signifikan mengurangi waktu respons dan biaya operasional dibandingkan dengan basis data vektor lainnya.
Grouping Search meningkatkan kemampuan Milvus untuk mengelola kueri bervolume tinggi dan kompleks serta selaras dengan praktik komputasi berkinerja tinggi untuk solusi manajemen data yang kuat.
Dukungan Beta untuk Penyematan Vektor Jarang
Penyematan vektorjarang mewakili pergeseran paradigma dari pendekatan vektor padat tradisional, yang memenuhi nuansa kemiripan semantik daripada sekadar frekuensi kata kunci. Perbedaan ini memungkinkan kemampuan pencarian yang lebih bernuansa, selaras dengan konten semantik dari kueri dan dokumen. Model vektor yang jarang, terutama berguna dalam pencarian informasi dan pemrosesan bahasa alami, menawarkan kemampuan pencarian di luar domain yang kuat dan kemampuan penafsiran dibandingkan dengan model vektor yang padat.
Di Milvus 2.4, kami telah memperluas Pencarian Hibrida untuk menyertakan sematan jarang yang dihasilkan oleh model saraf tingkat lanjut seperti SPLADEv2 atau model statistik seperti BM25. Dalam Milvus, vektor jarang diperlakukan setara dengan vektor padat, memungkinkan pembuatan koleksi dengan bidang vektor yang jarang, penyisipan data, pembuatan indeks, dan melakukan pencarian kemiripan. Khususnya, penyisipan jarang di Milvus mendukung metrik jarak Inner Product (IP), yang menguntungkan karena sifatnya yang berdimensi tinggi, sehingga membuat metrik lain menjadi kurang efektif. Fungsionalitas ini juga mendukung tipe data dengan dimensi sebagai bilangan bulat 32-bit yang tidak ditandatangani dan float 32-bit untuk nilainya, sehingga memfasilitasi spektrum aplikasi yang luas, mulai dari pencarian teks yang bernuansa hingga sistem pencarian informasi yang rumit.
Dengan fitur baru ini, Milvus memungkinkan metodologi pencarian hibrida yang memadukan teknik berbasis kata kunci dan penyematan, menawarkan transisi yang mulus bagi pengguna yang beralih dari kerangka kerja pencarian yang berpusat pada kata kunci untuk mencari solusi yang komprehensif dan rendah biaya.
Kami memberi label fitur ini sebagai "Beta" untuk melanjutkan pengujian kinerja fitur ini dan mengumpulkan umpan balik dari komunitas. Ketersediaan umum (GA) dari dukungan vektor jarang diantisipasi dengan rilis Milvus 3.0.
Dukungan Indeks CAGRA untuk Pengindeksan Grafis yang Dipercepat GPU Tingkat Lanjut
Dikembangkan oleh NVIDIA, CAGRA (Cuda Anns GRAph-based) adalah teknologi pengindeksan grafik berbasis GPU yang secara signifikan melampaui metode tradisional berbasis CPU seperti indeks HNSW dalam hal efisiensi dan performa, terutama di lingkungan dengan throughput tinggi.
Dengan diperkenalkannya Indeks CAGRA, Milvus 2.4 menyediakan kemampuan pengindeksan grafik yang dipercepat dengan GPU. Peningkatan ini sangat ideal untuk membangun aplikasi pencarian kemiripan yang membutuhkan latensi minimal. Selain itu, Milvus 2.4 mengintegrasikan pencarian brute-force dengan indeks CAGRA untuk mencapai tingkat penarikan maksimum dalam aplikasi. Untuk wawasan yang lebih detail, jelajahi blog pengenalan CAGRA.
Milvus Rakit CAGRA vs Milvus HNSW
Peningkatan dan Fitur Tambahan
Milvus 2.4 juga menyertakan peningkatan utama lainnya, seperti dukungan Regular Expression untuk pencocokan substring yang disempurnakan dalam pemfilteran metadata, indeks terbalik skalar baru untuk pemfilteran tipe data skalar yang efisien, dan alat Change Data Capture untuk memonitor dan mereplikasi perubahan pada koleksi Milvus. Pembaruan ini secara kolektif meningkatkan kinerja dan keserbagunaan Milvus, menjadikannya solusi yang komprehensif untuk operasi data yang kompleks.
Untuk lebih jelasnya, lihat dokumentasi Milvus 2.4.
Tetap Terhubung!
Bersemangat untuk mempelajari lebih lanjut tentang Milvus 2.4? Bergabunglah dengan webinar kami yang akan datang bersama James Luan, VP of Engineering Zilliz, untuk diskusi mendalam tentang kemampuan rilis terbaru ini. Jika Anda memiliki pertanyaan atau umpan balik, bergabunglah dengan saluran Discord kami untuk berinteraksi dengan para insinyur dan anggota komunitas kami. Jangan lupa untuk mengikuti kami di Twitter atau LinkedIn untuk mendapatkan berita dan informasi terbaru tentang Milvus.
- Pencarian Multi-vektor yang Diaktifkan untuk Pencarian Multimodal yang Disederhanakan
- Dukungan Pengelompokan Pencarian untuk Meningkatkan Efisiensi Komputasi
- Dukungan Beta untuk Penyematan Vektor Jarang
- Dukungan Indeks CAGRA untuk Pengindeksan Grafis yang Dipercepat GPU Tingkat Lanjut
- Peningkatan dan Fitur Tambahan
- Tetap Terhubung!
On This Page
Try Managed Milvus for Free
Zilliz Cloud is hassle-free, powered by Milvus and 10x faster.
Get StartedLike the article? Spread the word