🚀 جرب Zilliz Cloud، الـ Milvus المدارة بالكامل، مجاناً — تجربة أداء أسرع بـ 10 أضعاف! جرب الآن>>

milvus-logo
LFAI
الصفحة الرئيسية
  • دليل المستخدم
  • Home
  • Docs
  • دليل المستخدم

  • المخطط وحقول البيانات

  • المحلل

  • الفلاتر

  • ستيمير

الجذع

يقوم مرشح stemmer بتقليل الكلمات إلى شكلها الأساسي أو الجذري (المعروف باسم الجذع)، مما يسهل مطابقة الكلمات ذات المعاني المتشابهة عبر تصريفات مختلفة. يدعم مرشح stemmer لغات متعددة، مما يسمح بالبحث والفهرسة الفعالة في سياقات لغوية مختلفة.

التكوين

عامل التصفية stemmer هو عامل تصفية مخصص في ميلفوس. لاستخدامه، حدد "type": "stemmer" في تكوين الفلتر، إلى جانب معلمة language لتحديد اللغة المرغوبة للوقف.

analyzer_params = {
    "tokenizer": "standard",
    "filter":[{
        "type": "stemmer", # Specifies the filter type as stemmer
        "language": "english", # Sets the language for stemming to English
    }],
}

يقبل عامل التصفية stemmer المعلمات التالية القابلة للتكوين.

المعلمة

الوصف

language

تحديد لغة عملية الجذع. اللغات المدعومة تشمل: "arabic" "danish" و "dutch" و و "english" و و "finnish" و "french" و "german" و و "greek" و "hungarian" و "italian" و "norwegian" و و "portuguese" و "romanian" و "russian" و "spanish" و "swedish" و "tamil" و "turkish"

يعمل مرشح stemmer على المصطلحات التي تم إنشاؤها بواسطة أداة الترميز، لذلك يجب استخدامه مع أداة الترميز.

بعد تحديد analyzer_params ، يمكنك تطبيقها على حقل VARCHAR عند تحديد مخطط المجموعة. يسمح ذلك لميلفوس بمعالجة النص في ذلك الحقل باستخدام المحلل المحدد من أجل الترميز والتصفية الفعالة. لمزيد من التفاصيل، راجع مثال الاستخدام.

مثال على الإخراج

فيما يلي مثال على كيفية معالجة عامل التصفية stemmer للنص.

النص الأصلي.

"running runs looked ran runner"

الإخراج المتوقع (مع language: "english").

["run", "run", "look", "ran", "runner"]

جرب Managed Milvus مجاناً

Zilliz Cloud خالي من المتاعب، ويعمل بواسطة Milvus ويعمل بسرعة 10 أضعاف.

ابدأ
التعليقات

هل كانت هذه الصفحة مفيدة؟