الأحرف الصغيرة
يقوم عامل التصفية lowercase
بتحويل المصطلحات التي تم إنشاؤها بواسطة أداة الترميز إلى أحرف صغيرة، مما يجعل عمليات البحث غير حساسة لحالة الأحرف. على سبيل المثال، يمكنه تحويل ["High", "Performance", "Vector", "Database"]
إلى ["high", "performance", "vector", "database"]
.
التكوين
عامل التصفية lowercase
مدمج في ميلفوس. لاستخدامه، ما عليك سوى تحديد اسمه في قسم filter
داخل analyzer_params
.
analyzer_params = {
"tokenizer": "standard",
"filter": ["lowercase"],
}
يعمل مرشح lowercase
على المصطلحات التي تم إنشاؤها بواسطة أداة الترميز، لذلك يجب استخدامه مع أداة الترميز.
بعد تحديد analyzer_params
، يمكنك تطبيقها على حقل VARCHAR
عند تحديد مخطط المجموعة. يسمح ذلك لميلفوس بمعالجة النص في ذلك الحقل باستخدام المحلل المحدد من أجل الترميز والتصفية الفعالة. لمزيد من التفاصيل، راجع مثال الاستخدام.
مثال على الإخراج
فيما يلي مثال على كيفية معالجة عامل التصفية lowercase
للنص.
النص الأصلي.
"The Lowercase Filter Ensures Uniformity In Text Processing."
الإخراج المتوقع.
["the", "lowercase", "filter", "ensures", "uniformity", "in", "text", "processing"]