소문자
lowercase
필터는 토큰화 도구에서 생성된 용어를 소문자로 변환하여 대소문자를 구분하지 않고 검색할 수 있도록 합니다. 예를 들어 ["High", "Performance", "Vector", "Database"]
을 ["high", "performance", "vector", "database"]
으로 변환할 수 있습니다.
구성
lowercase
필터는 Milvus에 내장되어 있습니다. 사용하려면 analyzer_params
내의 filter
섹션에 이름을 지정하기만 하면 됩니다.
analyzer_params = {
"tokenizer": "standard",
"filter": ["lowercase"],
}
lowercase
필터는 토큰화 도구에서 생성된 용어에 대해 작동하므로 토큰화 도구와 함께 사용해야 합니다.
analyzer_params
을 정의한 후 컬렉션 스키마를 정의할 때 VARCHAR
필드에 적용할 수 있습니다. 이렇게 하면 Milvus가 지정된 분석기를 사용하여 해당 필드의 텍스트를 처리하여 효율적인 토큰화 및 필터링을 수행할 수 있습니다. 자세한 내용은 사용 예시를 참조하세요.
예제 출력
다음은 lowercase
필터가 텍스트를 처리하는 방법의 예입니다.
원본 텍스트.
"The Lowercase Filter Ensures Uniformity In Text Processing."
예상 출력
["the", "lowercase", "filter", "ensures", "uniformity", "in", "text", "processing"]