Milvus
Zilliz
  • Home
  • Blog
  • 7 Tahun, 2 Pembangunan Ulang Besar-besaran, 40K+ Bintang GitHub: Bangkitnya Milvus sebagai Basis Data Vektor Sumber Terbuka Terkemuka

7 Tahun, 2 Pembangunan Ulang Besar-besaran, 40K+ Bintang GitHub: Bangkitnya Milvus sebagai Basis Data Vektor Sumber Terbuka Terkemuka

  • announcements
December 02, 2025
Fendy Feng

Pada bulan Juni 2025, Milvus mencapai 35.000 bintang GitHub. Hanya dalam beberapa bulan, kami telah melewati angka 40.000. Inibukan hanya buktimomentum, tetapi juga bukti komunitas global yang terus mendorong masa depan pencarian vektor dan multimoda.

Kami sangat berterima kasih. Kepada semua orang yang telah membintangi, bercabang, mengajukan masalah, berdebat tentang API, berbagi tolok ukur, atau membangun sesuatu yang luar biasa dengan Milvus: Terima kasih, dan Anda adalah alasan mengapa proyek ini bergerak secepat ini. Setiap bintang mewakili lebih dari sekadar tombol yang ditekan - ini mencerminkan seseorang yang memilih Milvus untuk mendukung pekerjaan mereka, seseorang yang percaya dengan apa yang kami bangun, seseorang yang memiliki visi yang sama dengan kami untuk infrastruktur AI yang terbuka, mudah diakses, dan berkinerja tinggi.

Jadi, saat kami merayakannya, kami juga melihat ke depan - ke fitur-fitur yang Anda minta, ke arsitektur yang sekarang dibutuhkan oleh AI, dan ke dunia di mana pemahaman multimodal dan semantik menjadi standar di setiap aplikasi.

Perjalanan: Dari Nol hingga 40.000+ Bintang

Ketika kami mulai membangun Milvus pada tahun 2017, istilah basis data vektor bahkan belum ada. Kami hanyalah sebuah tim kecil yang terdiri dari para insinyur yang yakin bahwa aplikasi AI akan segera membutuhkan jenis infrastruktur data baru - yang dibangun bukan untuk baris dan kolom, tetapi untuk data berdimensi tinggi, tidak terstruktur, dan multimodal. Basis data tradisional tidak dibuat untuk dunia tersebut, dan kami tahu bahwa seseorang harus membayangkan kembali seperti apa penyimpanan dan pengambilannya.

Masa-masa awal sangat jauh dari kata glamor. Membangun infrastruktur tingkat perusahaan berjalan lambat dan sulit - kami menghabiskan waktu berminggu-minggu untuk membuat profil jalur kode, menulis ulang komponen, dan mempertanyakan pilihan desain pada pukul 2 pagi. Namun kami berpegang pada misi yang sederhana: membuat pencarian vektor dapat diakses, dapat diskalakan, dan dapat diandalkan oleh setiap pengembang yang membangun aplikasi AI. Misi tersebut membawa kami melewati terobosan pertama dan melalui kemunduran yang tak terelakkan.

Dan di sepanjang jalan, beberapa titik balik mengubah segalanya:

  • 2019: Kami membuka sumber terbuka Milvus 0.10. Ini berarti mengekspos semua sisi buruk kami - peretasan, TODO, bagian yang belum kami banggakan. Tetapi komunitas muncul. Para pengembang mengajukan masalah yang tidak pernah kami temukan, mengusulkan fitur yang tidak pernah kami bayangkan, dan menantang asumsi yang pada akhirnya membuat Milvus menjadi lebih kuat.

  • 2020-2021: Kami bergabung dengan LF AI & Data Foundation, meluncurkan Milvus 1.0, lulus dari LF AI & Data, dan memenangkan tantangan pencarian vektor berskala miliaran BigANN-bukti awal bahwa arsitektur kami dapat menangani skala dunia nyata.

  • 2022: Pengguna perusahaan membutuhkan penskalaan asli Kubernetes, elastisitas, dan pemisahan nyata antara penyimpanan dan komputasi. Kami dihadapkan pada keputusan sulit: menambal sistem lama atau membangun ulang semuanya. Kami memilih jalan yang lebih sulit. Milvus 2.0 merupakan penemuan ulang dari awal, memperkenalkan arsitektur cloud-native yang sepenuhnya terpisah yang mengubah Milvus menjadi platform kelas produksi untuk beban kerja AI yang sangat penting.

  • 2024-2025: Zilliz (tim di balik Milvus) dinobatkan sebagai pemimpin oleh Forrester, melonjak melewati 30.000 bintang, dan sekarang melampaui 40.000 bintang. Zilliz menjadi tulang punggung untuk pencarian multimodal, sistem RAG, alur kerja agen, dan pencarian berskala miliaran di berbagai industri-pendidikan, keuangan, produksi kreatif, penelitian ilmiah, dan banyak lagi.

Pencapaian ini diperoleh bukan karena hype, tetapi karena para pengembang memilih Milvus untuk beban kerja produksi yang nyata dan mendorong kami untuk meningkatkan setiap langkahnya.

2025: Dua Rilis Besar, Peningkatan Performa Besar-besaran

Tahun 2025 adalah tahun di mana Milvus melangkah ke liga yang baru. Meskipun pencarian vektor unggul dalam pemahaman semantik, kenyataannya dalam produksi adalah sederhana: pengembang masih membutuhkan pencocokan kata kunci yang tepat untuk ID produk, nomor seri, frasa yang tepat, istilah hukum, dan banyak lagi. Tanpa pencarian teks lengkap asli, tim dipaksa untuk mempertahankan klaster Elasticsearch/OpenSearch atau menyatukan solusi khusus mereka sendiri - menggandakan biaya operasional dan fragmentasi.

Milvus 2.5 mengubahnya. Milvus 2.5 memperkenalkan pencarian hibrida yang benar-benar asli, menggabungkan pencarian teks lengkap dan pencarian vektor ke dalam satu mesin. Untuk pertama kalinya, para pengembang dapat menjalankan kueri leksikal, kueri semantik, dan filter metadata secara bersamaan tanpa harus menyulap sistem tambahan atau menyinkronkan pipeline. Kami juga meningkatkan pemfilteran metadata, penguraian ekspresi, dan efisiensi eksekusi sehingga kueri hibrida terasa alami - dan cepat - di bawah beban produksi yang sebenarnya.

Milvus 2.6 mendorong momentum ini lebih jauh lagi, dengan menargetkan dua tantangan yang paling sering kami dengar dari para pengguna yang menjalankan dalam skala besar: biaya dan performa. Rilis ini menghadirkan peningkatan arsitektur yang mendalam - jalur kueri yang lebih mudah diprediksi, pengindeksan yang lebih cepat, penggunaan memori yang jauh lebih rendah, dan penyimpanan yang jauh lebih efisien. Banyak tim melaporkan keuntungan langsung tanpa mengubah satu baris pun kode aplikasi.

Berikut adalah beberapa hal penting dari Milvus 2.6:

  • Penyimpanan berjenjang yang memungkinkan tim menyeimbangkan biaya dan kinerja dengan lebih cerdas, memangkas biaya penyimpanan hingga 50%.

  • Penghematan memori yang sangat besar melalui kuantisasi RaBitQ 1-bit - mengurangi penggunaan memori hingga 72% namun tetap memberikan kueri yang lebih cepat.

  • Mesin teks lengkap yang didesain ulang dengan implementasi BM25 yang jauh lebih cepat - hingga 4 kali lebih cepat daripada Elasticsearch dalam tolok ukur kami.

  • Indeks Jalur baru untuk metadata berstruktur JSON, membuka penyaringan hingga 100× lebih cepat pada dokumen yang kompleks.

  • AiSAQ: kompresi skala miliaran dengan pengurangan penyimpanan 3200× dan pemanggilan kembali yang kuat

  • PencarianSemantik + Geospasial dengan R-Tree: Menggabungkan lokasi benda dengan artinya untuk hasil yang lebih relevan

  • CAGRA + Vamana: Memangkas biaya penerapan dengan mode CAGRA hibrida yang dibangun di atas GPU tetapi melakukan kueri di CPU

  • Alur kerja"data masuk, data keluar" yang menyederhanakan penyematan dan pengambilan data, terutama untuk pipeline multimodal.

  • Dukungan hingga 100 ribu koleksi dalam satu cluster - sebuah langkah besar menuju multi-tenancy dalam skala besar.

Untuk melihat lebih dalam tentang Milvus 2.6, lihat catatan rilis lengkapnya.

Lebih dari Milvus: Alat Sumber Terbuka untuk Pengembang AI

Pada tahun 2025, kami tidak hanya meningkatkan Milvus-kami membangun alat yang memperkuat seluruh ekosistem pengembang AI. Tujuan kami bukan untuk mengejar tren, tetapi untuk memberikan para pengembang alat yang terbuka, kuat, dan transparan yang selalu kami harapkan.

DeepSearcher: Penelitian Tanpa Penguncian Cloud

Deep Researcher dari OpenAI membuktikan apa yang dapat dilakukan oleh agen penalaran mendalam. Tapi itu tertutup, mahal, dan terkunci di balik API cloud. DeepSearcher adalah jawaban kami. Ini adalah mesin riset mendalam bersumber terbuka lokal yang dirancang untuk siapa saja yang menginginkan investigasi terstruktur tanpa mengorbankan kontrol atau privasi.

DeepSearcher berjalan sepenuhnya di mesin Anda, mengumpulkan informasi dari berbagai sumber, mensintesis wawasan, dan memberikan kutipan, langkah penalaran, dan penelusuran-fitur yang penting untuk penelitian yang sebenarnya, bukan hanya ringkasan di permukaan. Tidak ada kotak hitam. Tidak ada penguncian vendor. Hanya analisis yang transparan dan dapat direproduksi yang dapat dipercaya oleh para pengembang dan peneliti.

Konteks Claude: Asisten Pengkodean yang Benar-Benar Memahami Kode Anda

Sebagian besar alat pengkodean AI masih berperilaku seperti pipa grep yang mewah-cepat, dangkal, pembakaran token, dan tidak menyadari struktur proyek yang sebenarnya. Claude Context mengubahnya. Dibangun sebagai plugin MCP, akhirnya memberikan asisten pengkodean apa yang selama ini mereka lewatkan: pemahaman semantik asli dari basis kode Anda.

Claude Context membangun indeks semantik bertenaga vektor di seluruh proyek Anda, memungkinkan agen menemukan modul yang tepat, mengikuti hubungan di seluruh file, memahami maksud tingkat arsitektur, dan menjawab pertanyaan dengan relevansi daripada menebak-nebak. Ini mengurangi pemborosan token, meningkatkan presisi, dan yang paling penting-membiarkan asisten pengkodean berperilaku seolah-olah mereka benar-benar memahami perangkat lunak Anda daripada berpura-pura.

Kedua alat ini sepenuhnya bersifat open source. Karena infrastruktur AI seharusnya menjadi milik semua orang - dan karena masa depan AI tidak boleh terkunci di balik tembok kepemilikan.

Dipercaya oleh 10.000+ Tim dalam Produksi

Saat ini, lebih dari 10.000 tim perusahaan menjalankan Milvus dalam proses produksi-dari perusahaan rintisan yang sedang berkembang pesat hingga beberapa perusahaan teknologi paling mapan di dunia dan perusahaan-perusahaan yang masuk dalam daftar Fortune 500. Tim di NVIDIA, Salesforce, eBay, Airbnb, IBM, AT&T, LINE, Shopee, Roblox, Bosch, dan di dalam Microsoft mengandalkan Milvus untuk menggerakkan sistem AI yang beroperasi setiap menit setiap hari. Beban kerja mereka meliputi pencarian, rekomendasi, saluran agen, pengambilan multimodal, dan aplikasi lain yang mendorong infrastruktur vektor hingga batasnya.

Namun, yang paling penting bukanlah siapa yang menggunakan Milvus, melainkan apa yang mereka bangun dengan Milvus. Di berbagai industri, Milvus berada di balik sistem yang membentuk cara bisnis beroperasi, berinovasi, dan bersaing:

  • Kopilot AI dan asisten perusahaan yang meningkatkan dukungan pelanggan, alur kerja penjualan, dan pengambilan keputusan internal dengan akses instan ke miliaran embedding.

  • Pencarian semantik dan visual dalam e-commerce, media, dan periklanan, mendorong konversi yang lebih tinggi, penemuan yang lebih baik, dan produksi kreatif yang lebih cepat.

  • Platform intelijen hukum, keuangan, dan ilmiah di mana ketepatan, kemampuan audit, dan kepatuhan diterjemahkan ke dalam keuntungan operasional yang nyata.

  • Deteksi penipuan dan mesin risiko di fintech dan perbankan yang bergantung pada pencocokan semantik yang cepat untuk mencegah kerugian secara real time.

  • RAG berskala besar dan sistem agen yang memberikan perilaku AI yang sangat kontekstual dan sadar akan domain kepada tim.

  • Lapisan pengetahuan perusahaan yang menyatukan teks, kode, gambar, dan metadata ke dalam satu jalinan semantik yang koheren.

Dan ini bukanlah tolok ukur laboratorium-ini adalah beberapa penerapan produksi yang paling menuntut di dunia. Milvus secara rutin memberikannya:

  • Pengambilan dalam waktu sub-50ms di miliaran vektor

  • Miliaran dokumen dan peristiwa yang dikelola dalam satu sistem

  • Alur kerja 5-10× lebih cepat daripada solusi alternatif

  • Arsitektur multi-penyewa yang mendukung ratusan ribu koleksi

Tim memilih Milvus karena alasan sederhana: Milvus memberikan yang terbaik dalam hal yang penting-kecepatan, keandalan, efisiensi biaya, dan kemampuan untuk meningkatkan skala hingga miliaran tanpa mengobrak-abrik arsitektur mereka setiap beberapa bulan. Kepercayaan yang diberikan oleh tim-tim ini kepada kami adalah alasan kami terus memperkuat Milvus untuk dekade AI di masa depan.

Saat Anda Membutuhkan Milvus Tanpa Operasi: Zilliz Cloud

Milvus gratis, kuat, dan telah teruji dalam pertempuran. Namun, Milvus juga merupakan sistem terdistribusi-dan menjalankan sistem terdistribusi dengan baik adalah pekerjaan teknik yang sesungguhnya. Penyetelan indeks, manajemen memori, stabilitas cluster, penskalaan, pengamatan... tugas-tugas ini membutuhkan waktu dan keahlian yang tidak dimiliki oleh banyak tim. Para pengembang menginginkan kekuatan Milvus, hanya saja tanpa beban operasional yang pasti muncul saat mengelolanya dalam skala besar.

Kenyataan ini membawa kami pada kesimpulan sederhana: jika Milvus akan menjadi infrastruktur inti untuk aplikasi AI, kami perlu membuatnya mudah dioperasikan. Itulah mengapa kami membangun Zilliz Cloud, layanan Milvus yang dikelola sepenuhnya yang dibuat dan dikelola oleh tim yang sama di balik proyek sumber terbuka.

Zilliz Cloud memberikan para pengembang Milvus yang sudah mereka kenal dan percayai-tetapi tanpa penyediaan cluster, masalah kinerja pemadaman kebakaran, merencanakan peningkatan, atau mengkhawatirkan penyimpanan dan penyetelan komputasi. Dan karena mencakup pengoptimalan yang tidak mungkin dijalankan di lingkungan yang dikelola sendiri, Milvus menjadi lebih cepat dan lebih andal. Cardinal, mesin vektor kelas komersial kami yang mengoptimalkan sendiri, memberikan kinerja 10× lipat dari Milvus open-source.

Yang Membedakan Zilliz Cloud

  • Performa yang mengoptimalkan sendiri: AutoIndex secara otomatis menyetel HNSW, IVF, dan DiskANN, memberikan recall 96%+ tanpa konfigurasi manual.
  • Elastis & hemat biaya: Harga bayar sesuai pemakaian, autoscaling tanpa server, dan manajemen sumber daya cerdas sering kali mengurangi biaya hingga 50% atau lebih dibandingkan dengan penerapan yang dikelola sendiri.

  • Keandalan tingkat perusahaan: SLA waktu aktif 99,95%, redundansi multi-AZ, SOC 2 Tipe II, ISO 27001, dan kepatuhan terhadap GDPR. Dukungan penuh untuk RBAC, BYOC, log audit, dan enkripsi.

  • Penerapan cloud-agnostik: Dijalankan di AWS, Azure, GCP, Alibaba Cloud, atau Tencent Cloud-tanpa penguncian vendor, performa yang konsisten di mana saja.

  • Kueri bahasa alami: Dukungan server MCP internal memungkinkan Anda melakukan kueri data secara percakapan alih-alih membuat panggilan API secara manual.

  • Migrasi yang mudah: Pindah dari Milvus, Pinecone, Qdrant, Weaviate, Elasticsearch, atau PostgreSQL menggunakan alat migrasi bawaan - tidak perlu menulis ulang skema atau waktu henti.

  • 100% kompatibel dengan Milvus yang bersumber terbuka. Tidak ada garpu berpemilik. Tidak ada penguncian. Hanya Milvus, yang dibuat lebih mudah.

Milvus akan selalu menjadi sumber terbuka dan bebas digunakan. Namun, menjalankan dan mengoperasikannya dengan andal pada skala perusahaan membutuhkan keahlian dan sumber daya yang signifikan. Zilliz Cloud adalah jawaban kami untuk kesenjangan itu. Disebarkan di 29 wilayah dan lima cloud utama, Zilliz Cloud memberikan kinerja, keamanan, dan efisiensi biaya tingkat perusahaan sambil menjaga Anda tetap selaras dengan Milvus yang sudah Anda kenal.

Mulai uji coba gratis →

Selanjutnya: Danau Milvus

Sebagai tim yang memperkenalkan database vektor, kami telah melihat langsung bagaimana data perusahaan berubah. Apa yang dulunya muat dengan rapi ke dalam terabyte tabel terstruktur dengan cepat berubah menjadi petabyte - dan segera menjadi triliunan - objek multimodal. Teks, gambar, audio, video, aliran deret waktu, log multi-sensor... semua ini sekarang mendefinisikan kumpulan data yang diandalkan oleh sistem AI modern.

Basis data vektor dibuat khusus untuk data yang tidak terstruktur dan multimodal, tetapi tidak selalu merupakan pilihan yang paling ekonomis atau baik secara arsitektural-terutama jika sebagian besar datanya adalah data dingin. Korporasi pelatihan untuk model besar, log persepsi mengemudi secara otonom, dan kumpulan data robotika biasanya tidak memerlukan latensi tingkat milidetik atau konkurensi yang tinggi. Menjalankan volume data ini melalui basis data vektor waktu nyata menjadi mahal, berat secara operasional, dan terlalu rumit untuk pipeline yang tidak memerlukan tingkat kinerja tersebut.

Kenyataan tersebut membawa kami pada inisiatif besar berikutnya: Milvus Lake-sebuahdanau multimodal berbasis semantik dan berbasis indeks yang dirancang untuk data berskala AI. Milvus Lake menyatukan sinyal semantik di setiap modalitas-vektor, metadata, label, deskripsi yang dihasilkan LLM, dan bidang terstruktur-dan mengorganisasikannya ke dalam Semantic Wide Table yang berlabuh di sekitar entitas bisnis yang nyata. Data yang sebelumnya berada dalam bentuk file mentah yang tersebar di penyimpanan objek, lakehouse, dan pipeline model menjadi lapisan semantik yang terpadu dan dapat ditanyakan. Korporasi multimodal yang sangat besar berubah menjadi aset yang dapat dikelola, diambil, dan dapat digunakan kembali dengan makna yang konsisten di seluruh perusahaan.

Di bawah tenda, Milvus Lake dibangun di atas arsitektur manifes + data + indeks yang bersih yang memperlakukan pengindeksan sebagai hal yang mendasar, bukan sebagai renungan. Hal ini membuka alur kerja "ambil dulu, proses kemudian" yang dioptimalkan untuk data dingin berskala triliunan-menawarkan latensi yang dapat diprediksi, biaya penyimpanan yang jauh lebih rendah, dan stabilitas operasional yang jauh lebih besar. Pendekatan penyimpanan berjenjang - NVMe / SSD untuk jalur panas dan penyimpanan objek untuk arsip dalam - dipasangkan dengan kompresi yang efisien dan indeks yang dimuat dengan malas mempertahankan ketepatan semantik sambil menjaga infrastruktur tetap terkendali.

Milvus Lake juga terhubung dengan mulus ke dalam ekosistem data modern, terintegrasi dengan Paimon, Iceberg, Hudi, Spark, Ray, dan mesin serta format data besar lainnya. Tim dapat menjalankan pemrosesan batch, pipeline nyaris seketika, pengambilan semantik, rekayasa fitur, dan persiapan data pelatihan di satu tempat-tanpa perlu memformat ulang alur kerja yang sudah ada. Baik Anda sedang membangun korporasi model fondasi, mengelola perpustakaan simulasi mengemudi otonom, melatih agen robotika, atau memberdayakan sistem pengambilan berskala besar, Milvus Lake menyediakan gudang semantik yang dapat diperluas dan hemat biaya untuk era AI.

Milvus Lake sedang dalam pengembangan aktif. Tertarik dengan akses awal atau ingin mempelajari lebih lanjut?

Hubungi kami →

Dibangun oleh Komunitas, Untuk Komunitas

Yang membuat Milvus istimewa bukan hanya teknologinya, tetapi juga orang-orang di belakangnya. Basis kontributor kami tersebar di seluruh dunia, menyatukan para ahli dari komputasi berkinerja tinggi, sistem terdistribusi, dan infrastruktur AI. Insinyur dan peneliti dari ARM, NVIDIA, AMD, Intel, Meta, IBM, Salesforce, Alibaba, Microsoft, dan masih banyak lagi yang menyumbangkan keahliannya untuk membentuk Milvus menjadi seperti sekarang ini.

Setiap pull request, setiap laporan bug, setiap pertanyaan yang dijawab di forum kami, setiap tutorial yang dibuat-kontribusi ini membuat Milvus menjadi lebih baik untuk semua orang.

Pencapaian ini adalah milik Anda semua:

  • Untuk para kontributor kami: Terima kasih atas kode, ide, dan waktu Anda. Anda membuat Milvus menjadi lebih baik setiap harinya.

  • Kepada para pengguna kami: Terima kasih telah mempercayai Milvus dengan beban kerja produksi Anda dan berbagi pengalaman Anda, baik yang menyenangkan maupun yang menantang. Umpan balik Anda mendorong peta jalan kami.

  • Kepada para pendukung komunitas kami: Terima kasih telah menjawab pertanyaan, menulis tutorial, membuat konten, dan membantu pengguna baru untuk memulai. Anda membuat komunitas kami ramah dan inklusif.

  • Kepada mitra dan integrator kami: Terima kasih telah membangun bersama kami dan menjadikan Milvus sebagai warga kelas satu dalam ekosistem pengembangan AI.

  • Kepada tim Zilliz: Terima kasih atas komitmen Anda yang tak tergoyahkan untuk proyek open-source dan kesuksesan pengguna kami.

Milvus telah berkembang karena ribuan orang memutuskan untuk membangun sesuatu bersama - secara terbuka, murah hati, dan dengan keyakinan bahwa infrastruktur dasar AI harus dapat diakses oleh semua orang.

Bergabunglah dengan Kami dalam Perjalanan Ini

Baik Anda sedang membangun aplikasi pencarian vektor pertama Anda atau mengembangkannya menjadi miliaran vektor, kami ingin Anda menjadi bagian dari komunitas Milvus.

Memulai:

Jalan ke depan sangat menarik. Ketika AI membentuk kembali industri dan membuka kemungkinan-kemungkinan baru, basis data vektor akan menjadi inti dari transformasi ini. Bersama-sama, kami membangun fondasi semantik yang diandalkan oleh aplikasi AI modern - dan kami baru saja memulai.

Ini untuk 40.000 bintang berikutnya, dan untuk membangun masa depan infrastruktur AI bersama-sama. 🎉

    Try Managed Milvus for Free

    Zilliz Cloud is hassle-free, powered by Milvus and 10x faster.

    Get Started

    Like the article? Spread the word

    Terus Baca