Alphanumonly
يقوم عامل التصفية alphanumonly
بإزالة الرموز التي تحتوي على أحرف غير ASCII، مع الاحتفاظ فقط بالمصطلحات الأبجدية الرقمية. هذا الفلتر مفيد لمعالجة النصوص التي تكون فيها الأحرف والأرقام الأساسية فقط ذات صلة، مع استبعاد أي أحرف أو رموز خاصة.
التكوين
عامل التصفية alphanumonly
مدمج في ميلفوس. لاستخدامه، ما عليك سوى تحديد اسمه في القسم filter
داخل analyzer_params
.
analyzer_params = {
"tokenizer": "standard",
"filter": ["alphanumonly"],
}
يعمل عامل التصفية alphanumonly
على المصطلحات التي تم إنشاؤها بواسطة أداة الترميز، لذلك يجب استخدامه مع أداة الترميز.
بعد تحديد analyzer_params
، يمكنك تطبيقها على حقل VARCHAR
عند تحديد مخطط المجموعة. يسمح ذلك لميلفوس بمعالجة النص في ذلك الحقل باستخدام المحلل المحدد من أجل الترميز والتصفية الفعالة. لمزيد من التفاصيل، راجع مثال الاستخدام.
مثال على الإخراج
فيما يلي مثال على كيفية معالجة عامل التصفية alphanumonly
للنص.
النص الأصلي.
"Milvus 2.0 @ Scale! #AI #Vector_Databasé"
الإخراج المتوقع.
["Milvus", "2", "0", "Scale", "AI", "Vector"]