Huruf kecil
Filter lowercase
mengubah istilah yang dihasilkan oleh tokenizer menjadi huruf kecil, sehingga pencarian menjadi tidak peka huruf besar. Misalnya, filter ini dapat mengubah ["High", "Performance", "Vector", "Database"]
menjadi ["high", "performance", "vector", "database"]
.
Konfigurasi
Filter lowercase
sudah ada di dalam Milvus. Untuk menggunakannya, cukup tentukan namanya di bagian filter
di dalam analyzer_params
.
analyzer_params = {
"tokenizer": "standard",
"filter": ["lowercase"],
}
Filter lowercase
beroperasi berdasarkan ketentuan yang dihasilkan oleh tokenizer, sehingga harus digunakan bersama dengan tokenizer.
Setelah mendefinisikan analyzer_params
, Anda dapat menerapkannya ke bidang VARCHAR
ketika mendefinisikan skema koleksi. Hal ini memungkinkan Milvus untuk memproses teks dalam bidang tersebut menggunakan penganalisis yang ditentukan untuk tokenisasi dan pemfilteran yang efisien. Untuk detailnya, lihat Contoh penggunaan.
Contoh keluaran
Berikut adalah contoh bagaimana penyaring lowercase
memproses teks.
Teks asli.
"The Lowercase Filter Ensures Uniformity In Text Processing."
Keluaran yang diharapkan.
["the", "lowercase", "filter", "ensures", "uniformity", "in", "text", "processing"]