小寫
lowercase
過濾器可將 tokenizer 產生的詞彙轉換為小寫,使搜尋不區分大小寫。例如,它可以將["High", "Performance", "Vector", "Database"]
轉換為["high", "performance", "vector", "database"]
。
配置
lowercase
篩選器內建在 Milvus 中。要使用它,只需在analyzer_params
中的filter
部分指定其名稱。
analyzer_params = {
"tokenizer": "standard",
"filter": ["lowercase"],
}
lowercase
過濾器是在 tokenizer 產生的詞彙上運作,所以它必須與 tokenizer 結合使用。
定義analyzer_params
之後,您可以在定義集合模式時,將它們套用到VARCHAR
欄位。這可讓 Milvus 使用指定的分析器來處理該欄位中的文字,以進行有效率的標記化和過濾。詳情請參閱範例使用。
輸出範例
以下是lowercase
過濾器如何處理文字的範例。
原始文字。
"The Lowercase Filter Ensures Uniformity In Text Processing."
預期輸出。
["the", "lowercase", "filter", "ensures", "uniformity", "in", "text", "processing"]