🚀 Coba Zilliz Cloud, Milvus yang sepenuhnya terkelola, secara gratis—rasakan performa 10x lebih cepat! Coba Sekarang>>

milvus-logo
LFAI
  • Home
  • Blog
  • Bagaimana Platform Video Pendek Likee Menghapus Video Duplikat dengan Milvus

Bagaimana Platform Video Pendek Likee Menghapus Video Duplikat dengan Milvus

  • Scenarios
June 23, 2022
Xinyang Guo, Baoyu Han

Cover image Gambar sampul depan

Artikel ini ditulis oleh Xinyang Guo dan Baoyu Han, insinyur di BIGO, dan diterjemahkan oleh Rosie Zhang.

BIGO Technology (BIGO) adalah salah satu perusahaan teknologi Singapura dengan pertumbuhan tercepat. Didukung oleh teknologi kecerdasan buatan, produk dan layanan berbasis video BIGO telah mendapatkan popularitas yang luar biasa di seluruh dunia, dengan lebih dari 400 juta pengguna di lebih dari 150 negara. Produk dan layanan tersebut termasuk Bigo Live (live streaming) dan Likee (video berdurasi pendek).

Likee adalah platform pembuatan video pendek global di mana pengguna dapat berbagi momen, mengekspresikan diri, dan terhubung dengan dunia. Untuk meningkatkan pengalaman pengguna dan merekomendasikan konten yang lebih berkualitas kepada pengguna, Likee perlu menyaring video duplikat dari sejumlah besar video yang dibuat oleh pengguna setiap harinya, yang mana hal ini bukanlah tugas yang mudah.

Blog ini menyajikan bagaimana BIGO menggunakan Milvus, database vektor sumber terbuka, untuk menghapus video duplikat secara efektif.

Langsung ke:

Milvus adalah basis data vektor sumber terbuka yang menampilkan pencarian vektor yang sangat cepat. Didukung oleh Milvus, Likee dapat menyelesaikan pencarian dalam waktu 200 ms sekaligus memastikan tingkat penarikan yang tinggi. Sementara itu, dengan menskalakan Milvus secara horizontal, Likee berhasil meningkatkan hasil pencarian vektor, sehingga meningkatkan efisiensinya.

Bagaimana cara Likee mengidentifikasi video duplikat? Setiap kali video kueri dimasukkan ke dalam sistem Likee, video tersebut akan dipotong menjadi 15-20 frame dan setiap frame akan diubah menjadi vektor fitur. Kemudian Likee mencari dalam database 700 juta vektor untuk menemukan K vektor yang paling mirip. Masing-masing dari K vektor teratas berhubungan dengan sebuah video dalam database. Likee selanjutnya melakukan pencarian yang disempurnakan untuk mendapatkan hasil akhir dan menentukan video yang akan dihapus.

Mari kita lihat lebih dekat bagaimana sistem de-duplikasi video Likee bekerja menggunakan Milvus. Seperti yang ditunjukkan pada diagram di bawah ini, video baru yang diunggah ke Likee akan ditulis ke Kafka, sebuah sistem penyimpanan data, secara real-time dan dikonsumsi oleh konsumen Kafka. Vektor fitur dari video-video ini diekstraksi melalui model pembelajaran mendalam, di mana data tidak terstruktur (video) diubah menjadi vektor fitur. Vektor fitur ini akan dikemas oleh sistem dan dikirim ke auditor kemiripan.

Architechure of Likee's video de-duplication system Arsitektur sistem de-duplikasi video Likee

Vektor fitur yang diekstraksi akan diindeks oleh Milvus dan disimpan di Ceph, sebelum dimuat oleh simpul kueri Milvus untuk pencarian lebih lanjut. ID video yang sesuai dari vektor fitur ini juga akan disimpan secara bersamaan di TiDB atau Pika sesuai dengan kebutuhan yang sebenarnya.

Ketika mencari vektor yang mirip, miliaran data yang ada, bersama dengan sejumlah besar data baru yang dihasilkan setiap hari, menimbulkan tantangan besar pada fungsionalitas mesin pencari vektor. Setelah melakukan analisis menyeluruh, Likee akhirnya memilih Milvus, mesin pencari vektor terdistribusi dengan kinerja tinggi dan tingkat recall yang tinggi, untuk melakukan pencarian kemiripan vektor.

Seperti yang ditunjukkan pada diagram di bawah ini, prosedur pencarian kemiripan adalah sebagai berikut:

  1. Pertama, Milvus melakukan pencarian batch untuk mengingat 100 vektor yang mirip untuk setiap vektor fitur yang diekstrak dari video baru. Setiap vektor yang mirip terikat dengan ID video yang sesuai.

  2. Kedua, dengan membandingkan ID video, Milvus menghapus video duplikat dan mengambil vektor fitur dari video yang tersisa dari TiDB atau Pika.

  3. Terakhir, Milvus menghitung dan memberi nilai kemiripan antara setiap set vektor fitur yang diambil dan vektor fitur dari video kueri. ID video dengan skor tertinggi dikembalikan sebagai hasilnya. Dengan demikian pencarian kemiripan video selesai.

Procedure of a similarity search Prosedur pencarian kemiripan

Sebagai mesin pencari vektor berkinerja tinggi, Milvus telah melakukan pekerjaan yang luar biasa dalam sistem de-duplikasi video Likee, yang sangat mendorong pertumbuhan bisnis video pendek BIGO. Dalam hal bisnis video, ada banyak skenario lain di mana Milvus dapat diterapkan, seperti pemblokiran konten ilegal atau rekomendasi video yang dipersonalisasi. Baik BIGO maupun Milvus menantikan kerja sama di masa depan di lebih banyak bidang.

    Try Managed Milvus for Free

    Zilliz Cloud is hassle-free, powered by Milvus and 10x faster.

    Get Started

    Like the article? Spread the word

    Terus Baca