Minuscolo
Il filtro lowercase
converte i termini generati da un tokenizer in minuscolo, rendendo la ricerca insensibile alle maiuscole. Ad esempio, può convertire ["High", "Performance", "Vector", "Database"]
in ["high", "performance", "vector", "database"]
.
Configurazione
Il filtro lowercase
è integrato in Milvus. Per utilizzarlo, è sufficiente specificarne il nome nella sezione filter
all'interno di analyzer_params
.
analyzer_params = {
"tokenizer": "standard",
"filter": ["lowercase"],
}
Il filtro lowercase
opera sui termini generati dal tokenizer, quindi deve essere usato in combinazione con un tokenizer.
Dopo aver definito analyzer_params
, è possibile applicarli a un campo VARCHAR
quando si definisce uno schema di raccolta. Ciò consente a Milvus di elaborare il testo in quel campo utilizzando l'analizzatore specificato per una tokenizzazione e un filtraggio efficienti. Per i dettagli, vedere Esempio di utilizzo.
Esempio di output
Ecco un esempio di come il filtro lowercase
elabora il testo.
Testo originale.
"The Lowercase Filter Ensures Uniformity In Text Processing."
Risultato atteso.
["the", "lowercase", "filter", "ensures", "uniformity", "in", "text", "processing"]