جيبا
يعالج أداة الترميز jieba
النص الصيني عن طريق تقسيمه إلى الكلمات المكوّنة له.
التكوين
لتكوين محلل باستخدام أداة الترميز jieba
، قم بتعيين tokenizer
إلى jieba
في analyzer_params
.
analyzer_params = {
"tokenizer": "jieba",
}
بعد تحديد analyzer_params
، يمكنك تطبيقها على حقل VARCHAR
عند تحديد مخطط المجموعة. يسمح هذا لميلفوس بمعالجة النص في هذا الحقل باستخدام المحلل المحدد لترميز وتصفية فعالة. لمزيد من التفاصيل، راجع مثال الاستخدام.
مثال على الإخراج
فيما يلي مثال على كيفية معالجة أداة الترميز jieba
للنص.
النص الأصلي.
"Milvus 是一个高性能、可扩展的向量数据库!"
الإخراج المتوقع.
["Milvus", " ", "是", "一个", "高性", "性能", "高性能", "、", "可", "扩展", "的", "向量", "数据", "据库", "数据库", "!"]