Memulai Cepat dengan Attu Desktop
1. Pendahuluan
Attu adalah alat administrasi sumber terbuka yang lengkap untuk Milvus. Attu memiliki antarmuka pengguna grafis (GUI) yang intuitif, memungkinkan Anda untuk berinteraksi dengan database Anda dengan mudah. Hanya dengan beberapa klik, Anda dapat memvisualisasikan status cluster Anda, mengelola metadata, melakukan kueri data, dan banyak lagi.
2. Instal Aplikasi Desktop
Unduh versi desktop Attu dengan mengunjungi halaman Attu GitHub Releases. Pilih versi yang sesuai untuk sistem operasi Anda dan ikuti langkah-langkah instalasi.
Catatan untuk macOS (chip seri M):
Jika Anda mengalami kesalahan:
attu.app is damaged and cannot be opened.
Jalankan perintah berikut di terminal untuk mengatasi masalah ini:
sudo xattr -rd com.apple.quarantine /Applications/attu.app
3. Menghubungkan ke Milvus
Attu mendukung koneksi ke Milvus Standalone dan Zilliz Cloud, memberikan fleksibilitas untuk bekerja dengan basis data lokal atau yang di-host di cloud.
Untuk menggunakan Milvus Standalone secara lokal:
- Mulai Milvus Standalone dengan mengikuti panduan instalasi Milvus.
- Buka Attu dan masukkan informasi koneksi:
- Alamat Milvus: URI server Milvus Standalone Anda, contoh: http://localhost:19530
- Pengaturan opsional lainnya: Anda dapat mengaturnya sesuai dengan konfigurasi Milvus Anda atau membiarkannya sebagai default.
- Klik Hubungkan untuk mengakses database Anda.
Anda juga dapat menghubungkan Milvus yang telah dikelola secara penuh di Zilliz Cloud. Cukup atur
Milvus Address
dantoken
ke Public Endpoint dan API key dari instance Zilliz Cloud Anda.
- Klik untuk mengakses database Anda.
4. Menyiapkan Data, Membuat Koleksi, dan Menyisipkan Data
4.1 Menyiapkan Data
Kami menggunakan halaman FAQ dari Dokumentasi Milvus 2.4.x sebagai kumpulan data untuk contoh ini.
Unduh dan Ekstrak Data:
wget https://github.com/milvus-io/milvus-docs/releases/download/v2.4.6-preview/milvus_docs_2.4.x_en.zip
unzip -q milvus_docs_2.4.x_en.zip -d milvus_docs
Memproses File Penurunan Harga:
from glob import glob
text_lines = []
for file_path in glob("milvus_docs/en/faq/*.md", recursive=True):
with open(file_path, "r") as file:
file_text = file.read()
text_lines += file_text.split("# ")
4.2 Hasilkan Penyematan
Tentukan model penyematan untuk menghasilkan penyematan teks menggunakan milvus_model
. Kami menggunakan model DefaultEmbeddingFunction
sebagai contoh, yang merupakan model penyematan yang sudah terlatih dan ringan.
from pymilvus import model as milvus_model
embedding_model = milvus_model.DefaultEmbeddingFunction()
# Generate test embedding
test_embedding = embedding_model.encode_queries(["This is a test"])[0]
embedding_dim = len(test_embedding)
print(embedding_dim)
print(test_embedding[:10])
Keluaran:
768
[-0.04836066 0.07163023 -0.01130064 -0.03789345 -0.03320649 -0.01318448
-0.03041712 -0.02269499 -0.02317863 -0.00426028]
4.3 Membuat Koleksi
Hubungkan ke Milvus dan buat koleksi:
from pymilvus import MilvusClient
# Connect to Milvus Standalone
client = MilvusClient(uri="http://localhost:19530")
collection_name = "attu_tutorial"
# Drop collection if it exists
if client.has_collection(collection_name):
client.drop_collection(collection_name)
# Create a new collection
client.create_collection(
collection_name=collection_name,
dimension=embedding_dim,
metric_type="IP", # Inner product distance
consistency_level="Strong"
)
4.4 Menyisipkan Data
Lakukan iterasi melalui baris teks, buat penyematan, dan masukkan data ke dalam Milvus:
from tqdm import tqdm
data = []
doc_embeddings = embedding_model.encode_documents(text_lines)
for i, line in enumerate(tqdm(text_lines, desc="Creating embeddings")):
data.append({"id": i, "vector": doc_embeddings[i], "text": line})
client.insert(collection_name=collection_name, data=data)
4.5 Memvisualisasikan Data dan Skema
Sekarang kita dapat memvisualisasikan skema data dan entitas yang disisipkan menggunakan antarmuka Attu. Skema menampilkan bidang yang telah ditentukan, termasuk bidang id
dengan tipe Int64
dan bidang vector
dengan tipe FloatVector(768)
dengan metrik Inner Product (IP)
. Koleksi ini dimuat dengan 72 entitas.
Selain itu, kita dapat melihat data yang disisipkan, termasuk ID, penyematan vektor, dan bidang dinamis yang menyimpan metadata seperti konten teks. Antarmuka mendukung pemfilteran dan kueri berdasarkan kondisi yang ditentukan atau bidang dinamis.
5. Memvisualisasikan Hasil Pencarian dan Hubungan
Attu menyediakan antarmuka yang kuat untuk memvisualisasikan dan mengeksplorasi hubungan data. Untuk memeriksa titik data yang dimasukkan dan hubungan kemiripannya, ikuti langkah-langkah berikut:
5.1 Melakukan Pencarian
Buka tab Pencarian Vektor di Attu.
- Klik tombol Generate Random Data untuk membuat kueri pengujian.
- Klik Cari untuk mengambil hasil berdasarkan data yang dihasilkan.
Hasilnya ditampilkan dalam sebuah tabel, yang menunjukkan ID, skor kemiripan, dan bidang dinamis untuk setiap entitas yang cocok.
5.2 Jelajahi Hubungan Data
Klik tombol Jelajahi di panel hasil untuk memvisualisasikan hubungan antara vektor kueri dan hasil pencarian dalam struktur seperti grafik pengetahuan.
- Simpul pusat mewakili vektor pencarian.
- Node yang terhubung mewakili hasil pencarian, dengan mengekliknya akan menampilkan informasi rinci dari node yang bersangkutan.
5.3 Memperluas Grafik
Klik dua kali pada simpul hasil mana pun untuk memperluas koneksinya. Tindakan ini akan memperlihatkan hubungan tambahan antara simpul yang dipilih dengan titik data lain dalam koleksi, sehingga menciptakan grafik pengetahuan yang lebih besar dan saling terhubung.
Tampilan yang diperluas ini memungkinkan eksplorasi yang lebih dalam tentang bagaimana titik-titik data terkait, berdasarkan kemiripan vektor.
6. Kesimpulan
Attu menyederhanakan pengelolaan dan visualisasi data vektor yang disimpan di Milvus. Dari penyisipan data hingga eksekusi kueri dan eksplorasi interaktif, Attu menyediakan antarmuka yang intuitif untuk menangani tugas-tugas pencarian vektor yang kompleks. Dengan fitur-fitur seperti dukungan skema dinamis, visualisasi pencarian grafis, dan filter kueri yang fleksibel, Attu memberdayakan pengguna untuk menganalisis kumpulan data berskala besar secara efektif.
Dengan memanfaatkan alat eksplorasi visual Attu, pengguna dapat lebih memahami data mereka, mengidentifikasi hubungan yang tersembunyi, dan membuat keputusan berdasarkan data. Mulailah menjelajahi dataset Anda sendiri hari ini dengan Attu dan Milvus!