🚀 جرب Zilliz Cloud، الـ Milvus المدارة بالكامل، مجاناً — تجربة أداء أسرع بـ 10 أضعاف! جرب الآن>>

milvus-logo
LFAI
  • Home
  • Blog
  • صنع مع ميلفوس توصيات الأخبار المدعومة بالذكاء الاصطناعي داخل متصفح شاومي للهواتف المحمولة

صنع مع ميلفوس توصيات الأخبار المدعومة بالذكاء الاصطناعي داخل متصفح شاومي للهواتف المحمولة

  • Scenarios
June 04, 2020
milvus

يلعب الذكاء الاصطناعي بالفعل دورًا رئيسيًا في المحتوى الذي نراه ونتفاعل معه كل يوم، بدءًا من موجزات وسائل التواصل الاجتماعي إلى توصيات قوائم التشغيل على Spotify. في محاولة لتمييز متصفح الويب الخاص بها على الهاتف المحمول، قامت شركة Xiaomi متعددة الجنسيات المصنعة للإلكترونيات ببناء محرك توصيات للأخبار مدعوم بالذكاء الاصطناعي. استُخدمت Milvus، وهي قاعدة بيانات متجهة مفتوحة المصدر مصممة خصيصًا للبحث عن التشابه والذكاء الاصطناعي، كمنصة أساسية لإدارة البيانات في التطبيق. تشرح هذه المقالة كيف قامت شاومي ببناء محرك التوصية بالأخبار المدعوم بالذكاء الاصطناعي، وكيف تم استخدام ميلفوس وخوارزميات الذكاء الاصطناعي الأخرى.


استخدام الذكاء الاصطناعي لاقتراح محتوى مخصص واختراق ضوضاء الأخبار

مع قيام صحيفة نيويورك تايمز وحدها بنشر أكثر من 230 قطعة من المحتوى كل يوم، فإن الحجم الهائل من المقالات التي يتم إنتاجها يجعل من المستحيل على الأفراد الحصول على رؤية شاملة لجميع الأخبار. وللمساعدة في غربلة الكميات الكبيرة من المحتوى، والتوصية بالمقالات الأكثر صلة أو إثارة للاهتمام، فإننا نلجأ بشكل متزايد إلى الذكاء الاصطناعي. وعلى الرغم من أن التوصيات لا تزال بعيدة عن الكمال، إلا أن التعلم الآلي ضروري بشكل متزايد لاختراق التدفق المستمر للمعلومات الجديدة التي تتدفق من عالمنا الذي يزداد تعقيداً وترابطاً.

تصنع شركة Xiaomi وتستثمر في الهواتف الذكية وتطبيقات الأجهزة المحمولة وأجهزة الكمبيوتر المحمولة والأجهزة المنزلية والعديد من المنتجات الأخرى. في محاولة لتمييز متصفح الهاتف المحمول الذي يأتي مثبتًا مسبقًا على العديد من الهواتف الذكية التي تبيعها الشركة والتي يزيد عددها عن 40 مليون هاتف ذكي كل ثلاثة أشهر، قامت شاومي ببناء نظام توصية بالأخبار فيه. عندما يقوم المستخدمون بتشغيل متصفح Xiaomi للهاتف المحمول، يتم استخدام الذكاء الاصطناعي للتوصية بمحتوى مشابه بناءً على سجل بحث المستخدم واهتماماته وغير ذلك. Milvus عبارة عن قاعدة بيانات بحث عن التشابه المتجه مفتوحة المصدر تُستخدم لتسريع استرجاع المقالات ذات الصلة.


كيف تعمل التوصية بالمحتوى المدعوم بالذكاء الاصطناعي؟

في جوهرها، تتضمن التوصية بالأخبار (أو أي نوع آخر من أنظمة التوصية بالمحتوى) مقارنة البيانات المدخلة بقاعدة بيانات ضخمة للعثور على معلومات متشابهة. تتضمن التوصية الناجحة بالمحتوى تحقيق التوازن بين الملاءمة والتوقيت المناسب، ودمج كميات هائلة من البيانات الجديدة بكفاءة - غالبًا في الوقت الفعلي.

لاستيعاب مجموعات البيانات الضخمة، تنقسم أنظمة التوصية عادةً إلى مرحلتين:

  1. الاسترجاع: أثناء الاسترجاع، يتم تضييق نطاق المحتوى من المكتبة الأوسع بناءً على اهتمامات المستخدم وسلوكه. في متصفح Xiaomi للهواتف المحمولة، يتم اختيار آلاف الأجزاء من المحتوى من مجموعة بيانات ضخمة تحتوي على ملايين المقالات الإخبارية.
  2. الفرز: بعد ذلك، يتم فرز المحتوى الذي تم اختياره أثناء الاسترجاع وفقًا لمؤشرات معينة قبل دفعه إلى المستخدم. وبينما يتفاعل المستخدمون مع المحتوى الموصى به، يتكيف النظام في الوقت الفعلي لتقديم اقتراحات أكثر ملاءمة.

يجب تقديم توصيات المحتوى الإخباري في الوقت الفعلي بناءً على سلوك المستخدم والمحتوى المنشور مؤخرًا. بالإضافة إلى ذلك، يجب أن يتطابق المحتوى المقترح مع اهتمامات المستخدم ونية البحث قدر الإمكان.


ميلفوس + بيرت = اقتراحات محتوى ذكية

Milvus عبارة عن قاعدة بيانات بحث عن التشابه المتجه مفتوحة المصدر يمكن دمجها مع نماذج التعلم العميق لتشغيل التطبيقات التي تشمل معالجة اللغة الطبيعية والتحقق من الهوية وغير ذلك الكثير. تقوم Milvus بفهرسة مجموعات البيانات المتجهة الكبيرة لجعل البحث أكثر كفاءة، وتدعم مجموعة متنوعة من أطر عمل الذكاء الاصطناعي الشائعة لتبسيط عملية تطوير تطبيقات التعلم الآلي. هذه الخصائص تجعل المنصة مثالية لتخزين البيانات المتجهة والاستعلام عنها، وهي عنصر حاسم في العديد من تطبيقات التعلم الآلي.

اختارت شركة Xiaomi منصة Milvus لإدارة البيانات المتجهة لنظامها الذكي للتوصيات الإخبارية لأنها سريعة وموثوقة وتتطلب الحد الأدنى من التكوين والصيانة. ومع ذلك، يجب إقران Milvus بخوارزمية ذكاء اصطناعي لبناء تطبيقات قابلة للنشر. اختارت Xiaomi BERT، وهو اختصار لـ BERT، وهو اختصار لـ "محولات تمثيل التشفير ثنائي الاتجاه"، كنموذج تمثيل اللغة في محرك التوصية الخاص بها. يمكن استخدام BERT كنموذج عام لفهم اللغة الطبيعية (NLU) يمكن أن يقود عددًا من مهام معالجة اللغة الطبيعية المختلفة. تشمل ميزاته الرئيسية ما يلي:

  • يُستخدم محول BERT كإطار عمل رئيسي للخوارزمية وهو قادر على التقاط العلاقات الصريحة والضمنية داخل الجمل وفيما بينها.
  • أهداف التعلم متعدد المهام، ونمذجة اللغة المقنعة (MLM)، والتنبؤ بالجملة التالية (NSP).
  • يعمل BERT بشكل أفضل مع كميات أكبر من البيانات، ويمكنه تعزيز تقنيات معالجة اللغة الطبيعية الأخرى مثل Word2Vec من خلال العمل كمصفوفة تحويل.

Blog_Xiaomi_1.jpeg Blog_Xiaomi_1.jpeg


تستخدم بنية شبكة BERT بنية محول متعدد الطبقات تتخلى عن الشبكات العصبية التقليدية RNN وCNN. وهي تعمل من خلال تحويل المسافة بين كلمتين في أي موضع إلى كلمة واحدة من خلال آلية الانتباه الخاصة بها، وتحل مشكلة التبعية التي استمرت في معالجة اللغات الطبيعية لبعض الوقت.

Blog-Xiaomi-2.jpeg Blog-Xiaomi-2.jpeg


Blog-Xiaomi-3.jpeg Blog-Xiaomi-3.jpeg


يوفر BERT نموذجًا بسيطًا وآخر معقدًا. المعلمات الفائقة المقابلة هي كما يلي: BERT BASE: L = 12، H = 768، A = 12، إجمالي المعلمات 110M؛ BERT LARGE: L = 24، H = 1024، A = 16، إجمالي عدد المعلمات 340M.

في المعلمات التشعبية المذكورة أعلاه، يمثل L عدد الطبقات في الشبكة (أي عدد كتل المحولات)، ويمثل A عدد الانتباه الذاتي في الانتباه متعدد الرؤوس، وحجم المرشح 4H.


نظام التوصية بالمحتوى الخاص بشركة Xiaomi

يعتمد نظام التوصية بالأخبار المستند إلى متصفح Xiaomi على ثلاثة مكونات رئيسية: التوجيه، وتعيين المعرف، وخدمة الجار الأقرب التقريبي (ANN).

التحويل إلى متجهات هي عملية يتم فيها تحويل عناوين المقالات إلى متجهات جمل عامة. يُستخدم نموذج SimBert، الذي يعتمد على BERT، في نظام توصيات Xiaomi. SimBert هو نموذج مكون من 12 طبقة بحجم مخفي يبلغ 768. يستخدم Simbert النموذج التدريبي الصيني L-12_H-768_A-12 للتدريب المستمر (مهمة التدريب هي "التعلم المتري +UniLM"، وقد تم تدريب 1.17 مليون خطوة على TITAN RTX مع مُحسِّن آدم (معدل التعلم 2e-6، حجم الدفعة 128). ببساطة، هذا ببساطة هو نموذج BERT الأمثل.

تقارن خوارزميات الشبكة العصبية الاصطناعية عناوين المقالات المتجهة بمكتبة الأخبار المخزنة في ميلفوس بالكامل، ثم تُرجع محتوى مشابه للمستخدمين. يتم استخدام تعيين المعرف للحصول على المعلومات ذات الصلة مثل مشاهدات الصفحة والنقرات للمقالات المقابلة.

Blog-Xiaomi-N1.jpeg Blog-Xiaomi-Xiaomi-N1.jpeg


يتم تحديث البيانات المخزنة في Milvus التي تشغّل محرك توصيات أخبار Xiaomi باستمرار، بما في ذلك المقالات الإضافية ومعلومات النشاط. وبينما يقوم النظام بدمج بيانات جديدة، يجب تطهير البيانات القديمة. في هذا النظام، يتم إجراء تحديثات كاملة للبيانات في الأيام T-1 الأولى ويتم إجراء تحديثات تدريجية في الأيام T اللاحقة.

على فترات زمنية محددة، يتم حذف البيانات القديمة وإدراج البيانات المعالجة لـ T-1 يومًا في المجموعة. هنا يتم دمج البيانات التي تم إنشاؤها حديثًا في الوقت الفعلي. وبمجرد إدراج البيانات الجديدة، يتم إجراء بحث عن التشابه في ميلفوس. يتم فرز المقالات المسترجعة مرة أخرى حسب معدل النقرات وعوامل أخرى، ويتم عرض المحتوى الأعلى للمستخدمين. في مثل هذا السيناريو حيث يتم تحديث البيانات بشكل متكرر ويجب تقديم النتائج في الوقت الفعلي، فإن قدرة Milvus على دمج البيانات الجديدة والبحث عنها بسرعة تجعل من الممكن تسريع توصية المحتوى الإخباري بشكل كبير في متصفح الهاتف المحمول من Xiaomi.


يجعل Milvus البحث عن التشابه المتجه أفضل

يُعد تحديد متجهات البيانات ثم حساب التشابه بين المتجهات أكثر تقنيات الاسترجاع استخدامًا. وقد أدى ظهور محركات البحث عن التشابه المتجه المستندة إلى الشبكة العصبية الاصطناعية إلى تحسين كفاءة حسابات التشابه بين المتجهات بشكل كبير. ومقارنةً بالحلول المماثلة، يوفر Milvus تخزينًا محسنًا للبيانات، ومجموعات أدوات تطوير البرمجيات (SDK) الوفيرة، وإصدارًا موزعًا يقلل بشكل كبير من عبء العمل على بناء طبقة الاسترجاع. بالإضافة إلى ذلك، يعد مجتمع Milvus النشط مفتوح المصدر موردًا قويًا يمكنه المساعدة في الإجابة عن الأسئلة واستكشاف المشاكل وحلها عند ظهورها.

إذا كنت ترغب في معرفة المزيد عن البحث عن التشابه المتجه و Milvus، تحقق من الموارد التالية:

اقرأ قصص المستخدمين الآخرين لمعرفة المزيد حول صنع الأشياء باستخدام Milvus.

    Try Managed Milvus for Free

    Zilliz Cloud is hassle-free, powered by Milvus and 10x faster.

    Get Started

    Like the article? Spread the word

    استمر في القراءة