Cara Membuat 4 Aplikasi AI Populer dengan Milvus
sampul blog.png
Milvus adalah basis data vektor sumber terbuka. Milvus mendukung penambahan, penghapusan, pembaruan, dan pencarian hampir seketika untuk kumpulan data vektor yang sangat besar yang dibuat dengan mengekstraksi vektor fitur dari data yang tidak terstruktur menggunakan model AI. Dengan seperangkat API intuitif yang komprehensif, dan dukungan untuk beberapa pustaka indeks yang diadopsi secara luas (misalnya, Faiss, NMSLIB, dan Annoy), Milvus mempercepat pengembangan aplikasi pembelajaran mesin dan operasi pembelajaran mesin (MLOps). Dengan Milvus, Anda dapat dengan cepat mengembangkan produk yang layak secara minimum (MVP) sambil menjaga biaya tetap rendah.
"Sumber daya apa saja yang tersedia untuk mengembangkan aplikasi AI dengan Milvus?" adalah pertanyaan yang sering ditanyakan di komunitas Milvus. Zilliz, perusahaan di balik Milvus, mengembangkan sejumlah demo yang memanfaatkan Milvus untuk melakukan pencarian kemiripan secepat kilat yang mendukung aplikasi cerdas. Kode sumber solusi Milvus dapat ditemukan di zilliz-bootcamp. Skenario interaktif berikut ini mendemonstrasikan pemrosesan bahasa alami (NLP), pencarian gambar terbalik, pencarian audio, dan visi komputer.
Jangan ragu untuk mencoba solusi-solusi tersebut untuk mendapatkan pengalaman langsung dengan skenario tertentu! Bagikan skenario aplikasi Anda sendiri melalui:
Langsung ke:
- Pemrosesan bahasa alami (chatbot)
- Pencarian gambar terbalik
- Pencarian audio
- Deteksi objek video (visi komputer)
Pemrosesan bahasa alami (chatbots)
Milvus dapat digunakan untuk membuat chatbot yang menggunakan pemrosesan bahasa alami untuk mensimulasikan operator langsung, menjawab pertanyaan, mengarahkan pengguna ke informasi yang relevan, dan mengurangi biaya tenaga kerja. Untuk mendemonstrasikan skenario aplikasi ini, Zilliz membangun chatbot bertenaga AI yang memahami bahasa semantik dengan menggabungkan Milvus dengan BERT, sebuah model pembelajaran mesin (machine learning/ML) yang dikembangkan untuk pra-pelatihan NLP.
👉Kode sumber:zilliz-bootcamp/intelligent_question_answering_v2
1.png
Cara menggunakan
Unggah dataset yang berisi pasangan pertanyaan dan jawaban. Format pertanyaan dan jawaban dalam dua kolom terpisah. Sebagai alternatif, dataset contoh tersedia untuk diunduh.
Setelah mengetikkan pertanyaan Anda, daftar pertanyaan serupa akan diambil dari set data yang diunggah.
Ungkapkan jawabannya dengan memilih pertanyaan yang paling mirip dengan pertanyaan Anda.
👉Video:[Demo] Sistem QA yang Didukung oleh Milvus
Bagaimana cara kerjanya
Pertanyaan diubah menjadi vektor fitur menggunakan model BERT Google, kemudian Milvus digunakan untuk mengelola dan menanyakan dataset.
Pemrosesan data:
- BERT digunakan untuk mengubah pasangan pertanyaan-jawaban yang diunggah menjadi vektor fitur 768 dimensi. Vektor-vektor tersebut kemudian diimpor ke Milvus dan diberi ID masing-masing.
- ID vektor pertanyaan dan jawaban yang sesuai disimpan di PostgreSQL.
Mencari pertanyaan-pertanyaan serupa:
- BERT digunakan untuk mengekstrak vektor fitur dari pertanyaan masukan pengguna.
- Milvus mengambil ID vektor untuk pertanyaan yang paling mirip dengan pertanyaan masukan.
- Sistem mencari jawaban yang sesuai di PostgreSQL.
Sistem pencarian gambar terbalik
Pencarian gambar terbalik mengubah e-commerce melalui rekomendasi produk yang dipersonalisasi dan alat pencarian produk serupa yang dapat meningkatkan penjualan. Dalam skenario aplikasi ini, Zilliz membangun sistem pencarian gambar terbalik dengan menggabungkan Milvus dengan VGG, sebuah model ML yang dapat mengekstrak fitur gambar.
👉Kode sumber: zilliz-bootcamp/image_search
2.jpeg
Cara menggunakan
- Unggah dataset gambar zip yang terdiri dari gambar .jpg saja (jenis file gambar lain tidak diterima). Sebagai alternatif, kumpulan data sampel tersedia untuk diunduh.
- Unggah gambar yang akan digunakan sebagai masukan pencarian untuk menemukan gambar yang serupa.
👉Video: [Demo] Pencarian Gambar Didukung oleh Milvus
Bagaimana cara kerjanya
Gambar diubah menjadi vektor fitur 512 dimensi menggunakan model VGG, kemudian Milvus digunakan untuk mengelola dan menanyakan dataset.
Pemrosesan data:
- Model VGG digunakan untuk mengubah dataset gambar yang diunggah menjadi vektor fitur. Vektor-vektor ini kemudian diimpor ke Milvus dan diberi ID masing-masing.
- Vektor fitur gambar, dan jalur berkas gambar yang sesuai, disimpan di CacheDB.
Mencari gambar yang serupa:
- VGG digunakan untuk mengubah gambar yang diunggah pengguna menjadi vektor fitur.
- ID vektor gambar yang paling mirip dengan gambar input diambil dari Milvus.
- Sistem mencari jalur file gambar yang sesuai di CacheDB.
Sistem pencarian audio
Pencarian ucapan, musik, efek suara, dan jenis pencarian audio lainnya memungkinkan untuk dengan cepat meminta data audio dalam jumlah besar dan memunculkan suara-suara yang mirip. Aplikasi termasuk mengidentifikasi efek suara yang mirip, meminimalkan pelanggaran IP, dan banyak lagi. Untuk mendemonstrasikan skenario aplikasi ini, Zilliz membangun sistem pencarian kemiripan audio yang sangat efisien dengan menggabungkan Milvus dengan PANN-jaringansyaraf tiruan audio yang sudah terlatih berskala besar yang dibangun untuk pengenalan pola audio.
👉Kode sumber:zilliz-bootcamp/audio_search 3.png
Cara menggunakan
- Unggah dataset audio yang di-zip yang hanya terdiri dari file .wav (jenis file audio lainnya tidak diterima). Sebagai alternatif, kumpulan data sampel tersedia untuk diunduh.
- Unggah file .wav untuk digunakan sebagai input pencarian untuk menemukan audio serupa.
👉Video: [Demo] Pencarian Audio Didukung oleh Milvus
Bagaimana cara kerjanya
Audio diubah menjadi vektor fitur menggunakan PANN, jaringan saraf audio berskala besar yang telah dilatih sebelumnya yang dibangun untuk pengenalan pola audio. Kemudian Milvus digunakan untuk mengelola dan menanyakan dataset.
Pemrosesan data:
- PANN mengubah audio dari set data yang diunggah menjadi vektor fitur. Vektor-vektor tersebut kemudian diimpor ke Milvus dan diberi ID masing-masing.
- ID vektor fitur audio dan jalur file .wav yang sesuai disimpan di PostgreSQL.
Mencari audio yang serupa:
- PANN digunakan untuk mengubah file audio yang diunggah pengguna menjadi vektor fitur.
- ID vektor audio yang paling mirip dengan file yang diunggah diambil dari Milvus dengan menghitung jarak inner product (IP).
- Sistem mencari jalur file audio yang sesuai di MySQL.
Pendeteksian objek video (visi komputer)
Deteksi objek video memiliki aplikasi dalam visi komputer, pengambilan gambar, mengemudi secara otonom, dan banyak lagi. Untuk mendemonstrasikan skenario aplikasi ini, Zilliz membangun sistem pendeteksian objek video dengan menggabungkan Milvus dengan teknologi dan algoritme termasuk OpenCV, YOLOv3, dan ResNet50.
👉Kode sumber: zilliz-bootcamp/video_analysis
4.png
Cara menggunakan
- Unggah dataset gambar zip yang terdiri dari file .jpg saja (jenis file gambar lainnya tidak diterima). Pastikan setiap file gambar diberi nama sesuai dengan objek yang digambarkan. Sebagai alternatif, dataset sampel tersedia untuk diunduh.
- Unggah video yang akan digunakan untuk analisis.
- Klik tombol putar untuk melihat video yang diunggah dengan hasil deteksi objek yang ditampilkan secara real time.
👉Video: [Demo] Sistem Deteksi Objek Video yang Didukung oleh Milvus
Bagaimana cara kerjanya
Gambar objek diubah menjadi vektor fitur 2048 dimensi menggunakan ResNet50. Kemudian Milvus digunakan untuk mengelola dan meminta dataset.
Pemrosesan data:
- ResNet50 mengubah gambar objek menjadi vektor fitur 2048 dimensi. Vektor-vektor tersebut kemudian diimpor ke Milvus dan diberi ID masing-masing.
- ID vektor fitur audio dan jalur file gambar yang sesuai disimpan di MySQL.
Mendeteksi objek dalam video:
- OpenCV digunakan untuk memangkas video.
- YOLOv3 digunakan untuk mendeteksi objek dalam video.
- ResNet50 mengubah gambar objek yang terdeteksi menjadi vektor fitur 2048 dimensi.
Milvus mencari gambar objek yang paling mirip dalam kumpulan data yang diunggah. Nama objek yang sesuai dan jalur file gambar diambil dari MySQL.
Try Managed Milvus for Free
Zilliz Cloud is hassle-free, powered by Milvus and 10x faster.
Get StartedLike the article? Spread the word