2023: tahun AI
Gambar ini dihasilkan oleh AI.
Artikel ini ditulis oleh James Luan dengan bantuan ChatGPT. James terutama menulis petunjuk dan mengulas serta menyempurnakan konten yang dihasilkan oleh AI.
2023: tahun AI
Tahun 2023 menandai titik balik yang sangat penting dalam kecerdasan buatan (AI). Model Bahasa Besar (Large Language Models/LLM ) telah menjadi pusat perhatian, mendapatkan pengakuan luas atas kemampuan pemrosesan bahasa alami yang luar biasa. Lonjakan popularitas ini secara substansial telah memperluas kemungkinan aplikasi pembelajaran mesin, memungkinkan pengembang untuk membangun aplikasi yang lebih cerdas dan interaktif.
Di tengah revolusi ini, basis data vektor telah muncul sebagai komponen penting, yang bertindak sebagai memori jangka panjang untuk LLM. Munculnya model Retrieval-Augmented Generation (RAG ), agen cerdas, dan aplikasi pengambilan multimodal telah menunjukkan potensi besar basis data vektor dalam meningkatkan efisiensi pengambilan data multimodal, mengurangi halusinasi pada LLM, dan melengkapi pengetahuan domain.
Evolusi LLM juga telah mengkatalisasi kemajuan yang signifikan dalam teknologi penyematan. Menurut Massive Text Embedding Benchmark (MTEB) Leaderboard di HuggingFace, model penyematan terkemuka seperti UEA, VoyageAI, CohereV3, dan Bge semuanya dirilis pada tahun 2023. Kemajuan ini telah meningkatkan efektivitas pengambilan vektor dari berbagai teknologi pencarian vektor seperti Milvus, memberikan kemampuan pemrosesan data yang lebih tepat dan efisien untuk aplikasi AI.
Namun, dengan semakin populernya basis data vektor, muncul perdebatan tentang perlunya solusi khusus. Puluhan perusahaan rintisan telah memasuki arena database vektor. Banyak database relasional dan NoSQL tradisional telah mulai memperlakukan vektor sebagai tipe data yang signifikan, dan banyak yang mengklaim mampu menggantikan database vektor khusus dalam setiap situasi.
Saat kita memasuki tahun 2024, ini adalah saat yang tepat untuk merefleksikan seluruh industri database vektor, dengan fokus khusus pada Milvus - sebuah produk yang menonjol dalam lanskap ini.
Milvus pada tahun 2023: angka tidak berbohong
Pertama kali diluncurkan pada tahun 2019, Milvus telah memelopori konsep basis data vektor dan secara konsisten mempertahankan reputasi untuk keandalan, skalabilitas, kualitas pencarian, dan kinerja yang tinggi. Pada tahun 2023, Milvus mencapai hasil yang mengesankan dan mengalami perubahan yang signifikan, terutama didorong oleh kemajuan pesat LLM dan booming aplikasi AIGC. Berikut adalah beberapa angka penting yang paling mewakili kemajuan Milvus pada tahun 2023.
NOL waktu henti selama peningkatan bergilir
Bagi mereka yang baru mengenal basis data vektor, fokus utama mereka berpusat pada fungsionalitas daripada pemeliharaan operasional. Banyak pengembang aplikasi juga kurang memperhatikan stabilitas dalam basis data vektor mereka daripada basis data transaksional karena aplikasi mereka sering kali masih dalam tahap awal eksplorasi. Namun, stabilitas menjadi sangat diperlukan jika Anda ingin menerapkan aplikasi AIGC Anda di lingkungan produksi dan mencapai pengalaman pengguna terbaik.
Milvus membedakan dirinya dengan memprioritaskan tidak hanya fungsionalitas tetapi juga stabilitas operasional. Kami menambahkan peningkatan bergulir ke Milvus mulai dari versi 2.2.3. Setelah penyempurnaan yang berkelanjutan, fitur ini dapat memastikan tidak ada waktu henti selama peningkatan tanpa mengganggu proses bisnis.
Peningkatan kinerja 3x lipat dalam lingkungan produksi
Meningkatkan kinerja pencarian vektor harus menjadi tujuan utama untuk database vektor. Banyak solusi pencarian vektor memilih untuk mendasarkan solusi mereka pada pengadaptasian algoritma HNSW agar dapat masuk ke pasar dengan cepat; sayangnya, hal ini membuat mereka menghadapi tantangan yang signifikan di lingkungan produksi dunia nyata, terutama dengan pencarian yang sangat terfilter (lebih dari 90%) dan seringnya penghapusan data. Milvus mempertimbangkan kinerja sejak awal dan unggul dalam mengoptimalkan kinerja selama fase pengembangan apa pun, terutama di lingkungan produksi, mencapai peningkatan tiga kali lipat dalam kinerja pencarian, terutama dalam pencarian yang difilter dan situasi penyisipan/pencarian streaming.
Untuk membantu komunitas database vektor lebih lanjut, kami memperkenalkan VectorDBBench, sebuah alat benchmarking sumber terbuka, tahun lalu. Alat ini sangat penting untuk evaluasi awal database vektor di berbagai kondisi. Tidak seperti metode evaluasi tradisional, VectorDBBench menilai basis data menggunakan data dunia nyata, termasuk kumpulan data yang sangat besar atau yang sangat mirip dengan data dari model penyematan yang sebenarnya, sehingga memberikan informasi yang lebih mendalam kepada pengguna untuk pengambilan keputusan yang tepat.
Peningkatan daya ingat sebesar 5% pada dataset Beir
Meskipun embedding padat telah terbukti efektif dalam pencarian vektor, mereka harus mengejar ketertinggalan saat mencari nama, objek, singkatan, dan konteks kueri pendek. Menanggapi keterbatasan mereka, Milvus telah memperkenalkan pendekatan kueri hibrida yang mengintegrasikan sematan padat dengan sematan jarang untuk meningkatkan kualitas hasil pencarian. Sinergi dari solusi hibrida ini dengan model perangkingan ulang telah menghasilkan peningkatan substansial sebesar 5% dalam tingkat penarikan pada dataset Beir, seperti yang divalidasi oleh pengujian kami.
Lebih dari sekadar peningkatan kualitas pencarian, Milvus juga telah meluncurkan solusi pengambilan berbasis grafik yang dirancang untuk embedding yang jarang, melampaui kinerja algoritme pencarian konvensional seperti WAND.
Pada kompetisi NeurIPS BigANN 2023, Zihao Wang, seorang insinyur berbakat di Zilliz, mempresentasikan Pyanns, sebuah algoritme pencarian yang menunjukkan keunggulan signifikan dibandingkan entri lain di jalur pencarian embedding yang jarang. Solusi terobosan ini merupakan pendahulu dari algoritme pencarian embedding yang jarang digunakan untuk lingkungan produksi.
Penghematan memori 10x lipat pada kumpulan data yang besar
Retrieval Augmented Generation (RAG) adalah kasus penggunaan yang paling populer untuk basis data vektor pada tahun 2023. Namun, peningkatan volume data vektor dengan aplikasi RAG menghadirkan tantangan penyimpanan untuk aplikasi ini. Tantangan ini terutama terjadi ketika volume vektor yang ditransformasikan melebihi volume potongan dokumen asli, yang berpotensi meningkatkan biaya penggunaan memori. Sebagai contoh, setelah membagi dokumen menjadi beberapa bagian, ukuran vektor float32 berdimensi 1536 dimensi (sekitar 3kb) yang ditransformasikan dari potongan 500 token (sekitar 1kb) akan lebih besar daripada potongan 500 token.
Milvus adalah basis data vektor sumber terbuka pertama yang mendukung pengindeksan berbasis disk, yang menghasilkan penghematan memori 5x lipat yang luar biasa. Pada akhir tahun 2023, kami memperkenalkan Milvus 2.3.4, yang memungkinkan kemampuan untuk memuat data/indeks skalar dan vektor ke dalam disk menggunakan file yang dipetakan dengan memori(MMap). Kemajuan ini menawarkan lebih dari 10x pengurangan penggunaan memori dibandingkan dengan pengindeksan dalam memori tradisional.
20 Rilis Milvus
Pada tahun 2023, Milvus menjalani perjalanan transformatif yang ditandai dengan pencapaian signifikan. Sepanjang tahun ini, kami meluncurkan 20 rilis, bukti dedikasi lebih dari 300 pengembang komunitas dan realisasi komitmen kami terhadap pendekatan yang digerakkan oleh pengguna dalam pengembangan.
Sebagai gambaran, Milvus 2.2.9 memperkenalkan skema dinamis, yang menandai pergeseran penting dari memprioritaskan kinerja ke peningkatan kegunaan. Berdasarkan hal ini, Milvus 2.3 memperkenalkan fitur-fitur penting seperti Upsert, Range Search, metrik Cosinus, dan banyak lagi, yang semuanya didorong oleh kebutuhan dan umpan balik spesifik dari komunitas pengguna kami. Proses pengembangan yang berulang ini menggarisbawahi komitmen kami untuk terus menyelaraskan Milvus dengan kebutuhan pengguna kami yang terus berkembang.
1.000.000 penyewa dalam Satu Custer
Menerapkan multi-tenancy sangat penting untuk mengembangkan sistem RAG, agen AI, dan aplikasi LLM lainnya, untuk memenuhi permintaan pengguna yang tinggi akan isolasi data. Untuk bisnis B2C, jumlah penyewa dapat meroket hingga jutaan, membuat isolasi fisik data pengguna menjadi tidak praktis (sebagai contoh, tidak mungkin ada orang yang membuat jutaan tabel dalam database relasional). Milvus memperkenalkan fitur Partition Key, yang memungkinkan isolasi logis yang efisien dan penyaringan data berdasarkan kunci partisi, yang sangat berguna dalam skala besar.
Sebaliknya, perusahaan B2B, yang terbiasa berurusan dengan puluhan ribu penyewa, mendapatkan keuntungan dari strategi yang lebih bernuansa yang melibatkan isolasi sumber daya fisik. Milvus 2.3.4 terbaru menghadirkan manajemen memori yang lebih baik, penanganan coroutine, dan pengoptimalan CPU, sehingga membuat pembuatan puluhan ribu tabel dalam satu cluster menjadi lebih mudah. Peningkatan ini juga mengakomodasi kebutuhan bisnis B2B dengan efisiensi dan kontrol yang lebih baik.
10.000.000 tarikan gambar Docker
Di penghujung tahun 2023, Milvus mencapai pencapaian yang mengesankan dengan 10 juta unduhan gambar Docker. Pencapaian ini menandakan meningkatnya ketertarikan komunitas pengembang terhadap Milvus dan menekankan signifikansinya yang semakin meningkat dalam domain basis data vektor.
Sebagai database vektor cloud-native pertama di dunia, Milvus menawarkan integrasi tanpa batas dengan Kubernetes dan ekosistem kontainer yang lebih luas. Melihat ke masa depan, kita tidak bisa tidak merenungkan titik fokus berikutnya dalam lanskap basis data vektor yang terus berkembang. Mungkinkah itu adalah kebangkitan layanan Tanpa Server?
10 miliar entitas dalam satu koleksi
Meskipun skalabilitas saat ini mungkin tidak mencuri perhatian dalam fenomena AI, skalabilitas tentu saja memainkan peran penting, jauh dari sekadar tontonan. Basis data vektor Milvus dapat dengan mulus meningkatkan skalabilitasnya untuk mengakomodasi miliaran data vektor tanpa perlu berkeringat. Lihatlah salah satu pelanggan LLM kami, sebagai contoh. Milvus dengan mudah membantu pelanggan ini menyimpan, memproses, dan mengambil 10 miliar titik data yang menakjubkan. Namun, bagaimana Anda menyeimbangkan biaya dan kinerja ketika berhadapan dengan volume data yang begitu besar? Tenang saja, Mivus memiliki berbagai kemampuan untuk membantu Anda mengatasi tantangan tersebut dan meningkatkan pengalaman Anda.
Lebih dari sekadar angka: wawasan baru ke dalam basis data vektor
Di luar pencapaian angka, tahun 2023 telah memperkaya kami dengan berbagai wawasan yang berharga. Kami telah mempelajari seluk-beluk lanskap basis data vektor, bergerak melampaui sekadar statistik untuk memahami nuansa halus dan dinamika yang berkembang dari teknologi pencarian vektor.
Aplikasi LLM masih dalam tahap awal.
Berkaca pada masa-masa awal booming internet seluler, banyak pengembang menciptakan aplikasi sederhana seperti senter atau prakiraan cuaca, yang pada akhirnya diintegrasikan ke dalam sistem operasi ponsel pintar. Tahun lalu, sebagian besar aplikasi AI Native, seperti AutoGPT, yang dengan cepat mencapai 100.000 bintang di GitHub, tidak memberikan nilai praktis tetapi hanya mewakili eksperimen yang berarti. Untuk aplikasi basis data vektor, kasus penggunaan saat ini mungkin hanyalah gelombang pertama transformasi AI Native, dan saya dengan penuh semangat mengantisipasi lebih banyak kasus penggunaan yang akan muncul.
Basis data vektor mengarah pada diversifikasi.
Serupa dengan evolusi database ke dalam kategori seperti OLTP, OLAP, dan NoSQL, database vektor menunjukkan tren yang jelas menuju diversifikasi. Berangkat dari fokus konvensional pada layanan online, analisis offline telah mendapatkan daya tarik yang signifikan. Contoh penting lainnya dari pergeseran ini adalah pengenalan GPTCache, cache semantik bersumber terbuka yang dirilis pada tahun 2023. Cache ini meningkatkan efisiensi dan kecepatan aplikasi berbasis GPT dengan menyimpan dan mengambil respons yang dihasilkan oleh model bahasa.
Kami berharap dan bersemangat untuk menyaksikan lebih banyak lagi aplikasi dan desain sistem yang lebih beragam dalam basis data vektor di tahun mendatang.
Operasi vektor menjadi lebih rumit.
Meskipun mendukung pencarian Approximate Nearest Neighbor (ANN) adalah fitur yang menentukan dari database vektor, ANN tidak berdiri sendiri. Keyakinan umum bahwa hanya dengan menyimpan Pencarian Tetangga Terdekat saja sudah cukup untuk mengklasifikasikan database sebagai database vektor atau database asli AI menyederhanakan seluk-beluk operasi vektor. Di luar kemampuan dasar pemfilteran skalar hibrida dan pencarian vektor, basis data yang dirancang untuk aplikasi asli AI harus mendukung kemampuan semantik yang lebih canggih seperti Pemfilteran NN, Penggabungan KNN, dan kueri klaster.
Skalabilitas elastis sangat penting untuk aplikasi asli AI.
Pertumbuhan eksponensial aplikasi AI, yang dicontohkan oleh ChatGPT yang mengumpulkan lebih dari 100 juta pengguna aktif bulanan dalam dua bulan, melampaui lintasan bisnis sebelumnya. Peningkatan yang cepat dari 1 juta menjadi 1 miliar titik data menjadi hal yang sangat penting ketika bisnis mencapai pertumbuhannya. Pengembang aplikasi AI mendapatkan keuntungan dari model layanan pay-as-you-go yang ditetapkan oleh penyedia LLM, yang mengarah pada pengurangan substansial dalam biaya operasional. Demikian pula, menyimpan data yang selaras dengan model penetapan harga ini terbukti menguntungkan bagi para pengembang, memungkinkan mereka untuk menyalurkan lebih banyak perhatian ke bisnis inti.
Tidak seperti Model Bahasa (LLM) dan berbagai sistem teknologi lainnya, basis data vektor beroperasi dengan cara yang penuh, menuntut penyimpanan data yang persisten untuk fungsionalitasnya. Oleh karena itu, ketika memilih database vektor, sangat penting untuk memprioritaskan elastisitas dan skalabilitas. Prioritas ini memastikan keselarasan dengan tuntutan dinamis dari aplikasi AI yang terus berkembang, menyoroti kebutuhan akan kemampuan beradaptasi tanpa batas terhadap perubahan beban kerja.
Memanfaatkan pembelajaran mesin dalam basis data vektor dapat memberikan hasil yang luar biasa.
Pada tahun 2023, investasi besar kami dalam proyek AI4DB (AI for Database) menghasilkan kesuksesan yang luar biasa. Sebagai bagian dari upaya kami, kami memperkenalkan dua kemampuan penting ke Zilliz Cloud, solusi Milvus yang dikelola sepenuhnya: 1) AutoIndex, indeks penyetelan parameter otomatis yang berakar pada pembelajaran mesin, dan 2) strategi partisi data berdasarkan pengelompokan data. Kedua inovasi ini memainkan peran penting dalam meningkatkan kinerja pencarian Zilliz Cloud secara signifikan.
Sumber terbuka vs sumber tertutup
LLM sumber tertutup seperti seri GPT OpenAI dan Claude saat ini memimpin, menempatkan komunitas sumber terbuka dirugikan karena tidak adanya sumber daya komputasi dan data yang sebanding.
Namun, dalam basis data vektor, open source pada akhirnya akan menjadi pilihan yang disukai oleh para pengguna. Memilih open source memberikan banyak keuntungan, termasuk kasus penggunaan yang lebih beragam, iterasi yang lebih cepat, dan menumbuhkan ekosistem yang lebih kuat. Selain itu, sistem basis data sangat rumit sehingga mereka tidak dapat memberikan opasitas yang sering dikaitkan dengan LLM. Pengguna harus benar-benar memahami basis data sebelum memilih pendekatan yang paling masuk akal untuk pemanfaatannya. Selain itu, transparansi yang tertanam dalam open source memberdayakan pengguna untuk memiliki kebebasan dan kontrol untuk menyesuaikan basis data sesuai dengan kebutuhan mereka.
Epilog - Dan sebuah awal yang baru!
Seiring dengan cepatnya tahun 2023 berlalu di tengah-tengah perubahan transformatif, kisah database vektor baru saja dimulai. Perjalanan kami dengan basis data vektor Milvus adalah tentang sesuatu yang lain daripada tersesat dalam hype AIGC. Sebaliknya, kami fokus pada pengembangan produk kami dengan cermat, mengidentifikasi dan memelihara kasus penggunaan aplikasi yang selaras dengan kekuatan kami, dan dengan teguh melayani pengguna kami. Komitmen kami terhadap open source bertujuan untuk menjembatani kesenjangan antara kami dan pengguna kami, sehingga mereka dapat merasakan dedikasi dan keahlian kami, bahkan dari kejauhan.
Tahun 2023 juga menyaksikan banyak startup AI yang didirikan dan mendapatkan putaran pendanaan pertama mereka. Sangat menyenangkan melihat inovasi dari para pengembang ini, dan ini mengingatkan saya mengapa saya masuk ke pengembangan VectorDB sejak awal. Tahun 2024 akan menjadi tahun bagi semua aplikasi inovatif ini untuk mendapatkan daya tarik yang nyata, tidak hanya menarik pendanaan tetapi juga pelanggan yang membayar. Pendapatan pelanggan akan membawa persyaratan yang berbeda untuk para pengembang ini, karena membangun solusi yang sepenuhnya dapat diskalakan dengan sedikit atau tanpa waktu henti adalah yang terpenting.
Mari wujudkan hal-hal luar biasa di tahun 2024!
- Milvus pada tahun 2023: angka tidak berbohong
- Lebih dari sekadar angka: wawasan baru ke dalam basis data vektor
- Epilog - Dan sebuah awal yang baru!
On This Page
Try Managed Milvus for Free
Zilliz Cloud is hassle-free, powered by Milvus and 10x faster.
Get StartedLike the article? Spread the word