الجذع
يقوم مرشح stemmer
بتقليل الكلمات إلى شكلها الأساسي أو الجذري (المعروف باسم الجذع)، مما يسهل مطابقة الكلمات ذات المعاني المتشابهة عبر تصريفات مختلفة. يدعم مرشح stemmer
لغات متعددة، مما يسمح بالبحث والفهرسة الفعالة في سياقات لغوية مختلفة.
التكوين
عامل التصفية stemmer
هو عامل تصفية مخصص في ميلفوس. لاستخدامه، حدد "type": "stemmer"
في تكوين الفلتر، إلى جانب معلمة language
لتحديد اللغة المرغوبة للوقف.
analyzer_params = {
"tokenizer": "standard",
"filter":[{
"type": "stemmer", # Specifies the filter type as stemmer
"language": "english", # Sets the language for stemming to English
}],
}
يقبل عامل التصفية stemmer
المعلمات التالية القابلة للتكوين.
المعلمة | الوصف |
---|---|
| تحديد لغة عملية الجذع. اللغات المدعومة تشمل: |
يعمل مرشح stemmer
على المصطلحات التي تم إنشاؤها بواسطة أداة الترميز، لذلك يجب استخدامه مع أداة الترميز.
بعد تحديد analyzer_params
، يمكنك تطبيقها على حقل VARCHAR
عند تحديد مخطط المجموعة. يسمح ذلك لميلفوس بمعالجة النص في ذلك الحقل باستخدام المحلل المحدد من أجل الترميز والتصفية الفعالة. لمزيد من التفاصيل، راجع مثال الاستخدام.
مثال على الإخراج
فيما يلي مثال على كيفية معالجة عامل التصفية stemmer
للنص.
النص الأصلي.
"running runs looked ran runner"
الإخراج المتوقع (مع language: "english"
).
["run", "run", "look", "ran", "runner"]