تفعيل الذكاء الاصطناعي على نطاق واسع باستخدام برنامج 2.0 وMLOps وMilvus
إن بناء تطبيقات التعلم الآلي (ML) عملية معقدة ومتكررة. مع إدراك المزيد من الشركات للإمكانات غير المستغلة للبيانات غير المهيكلة، سيستمر الطلب على معالجة البيانات والتحليلات المدعومة بالذكاء الاصطناعي في الارتفاع. وبدون عمليات فعالة للتعلم الآلي أو MLOps، فإن معظم الاستثمارات في تطبيقات التعلم الآلي ستذبل على الكرمة. وقد وجدت الأبحاث أن 5% فقط من تطبيقات الذكاء الاصطناعي التي تخطط الشركات لنشرها تصل بالفعل إلى مرحلة النشر. تتكبد العديد من المؤسسات "ديونًا نموذجية"، حيث تؤدي التغيرات في ظروف السوق، والفشل في التكيف معها، إلى استثمارات غير محققة في النماذج التي تظل دون تجديد (أو الأسوأ من ذلك، لا يتم نشرها على الإطلاق).
تشرح هذه المقالة نهج MLOps، وهو نهج منهجي لإدارة دورة حياة نماذج الذكاء الاصطناعي، وكيف يمكن استخدام منصة إدارة البيانات المتجهة مفتوحة المصدر Milvus لتفعيل الذكاء الاصطناعي على نطاق واسع.
ما هي عمليات التعلّم الآلي؟
تعتبر عمليات تعلّم الآلة (MLOps)، والمعروفة أيضًا باسم عمليات النماذج (ModelOps) أو تشغيل نماذج الذكاء الاصطناعي، ضرورية لبناء تطبيقات الذكاء الاصطناعي وصيانتها ونشرها على نطاق واسع. نظرًا لأن الشركات تسعى إلى تطبيق نماذج الذكاء الاصطناعي التي تقوم بتطويرها على مئات السيناريوهات المختلفة، فمن المهم للغاية أن يتم تفعيل النماذج المستخدمة وتلك التي هي قيد التطوير في المؤسسة بأكملها. تتضمن عمليات التشغيل الآلي مراقبة نموذج التعلُّم الآلي طوال دورة حياته، والتحكم في كل شيء بدءًا من البيانات الأساسية وحتى فعالية نظام الإنتاج الذي يعتمد على نموذج معين.
01.jpg
تُعرّف شركة Gartner ModelOps بأنها الحوكمة وإدارة دورة حياة مجموعة واسعة من نماذج الذكاء الاصطناعي ونماذج اتخاذ القرار التشغيلية. يمكن تقسيم الوظائف الأساسية لعمليات التشغيل الآلي على النحو التالي:
التكامل المستمر/التسليم المستمر (CI/CD): مجموعة من أفضل الممارسات المقتبسة من عمليات المطورين (DevOps)، التكامل المستمر/التسليم المستمر هي طريقة لتقديم تغييرات التعليمات البرمجية بشكل أكثر تواتراً وموثوقية. ويعزز التكامل المستمر تنفيذ تغييرات التعليمات البرمجية على دفعات صغيرة مع مراقبتها من خلال التحكم الصارم في الإصدار. يعمل التسليم المستمر على أتمتة تسليم التطبيقات إلى بيئات مختلفة (مثل بيئات الاختبار والتطوير).
بيئات تطوير النماذج (MDE): هي عملية معقدة لبناء النماذج ومراجعتها وتوثيقها وفحصها، وتساعد بيئات تطوير النماذج على ضمان إنشاء النماذج بشكل متكرر، وتوثيقها أثناء تطويرها، والموثوقية في تطويرها، وقابليتها للتكرار. تضمن MDE الفعالة إمكانية استكشاف النماذج وبحثها وتجربتها بطريقة محكومة.
اختبار البطل-المتفوق: على غرار منهجية اختبار أ/ب المستخدمة من قبل المسوقين، يتضمن اختبار البطل-المتفوق تجربة حلول مختلفة للمساعدة في عملية اتخاذ القرار التي تمضي قدماً في الالتزام بنهج واحد. تتضمن هذه التقنية مراقبة وقياس الأداء في الوقت الفعلي لتحديد الانحراف الذي يعمل بشكل أفضل.
إصدار النماذج: كما هو الحال مع أي نظام معقد، يتم تطوير نماذج التعلّم الآلي على خطوات من قبل العديد من الأشخاص المختلفين - مما يؤدي إلى طرح أسئلة حول إدارة البيانات حول إصدارات البيانات ونماذج التعلّم الآلي. تساعد عملية إصدار النماذج على إدارة العملية التكرارية لتطوير تعلّم الآلة والتحكم فيها، حيث قد تتطور البيانات والنماذج والرموز بمعدلات مختلفة.
تخزين النماذج والتراجع: عندما يتم نشر نموذج، يجب تخزين ملف الصورة المقابل له. تسمح قدرات التراجع والاسترداد لفرق عمليات التشغيل الآلي بالعودة إلى إصدار نموذج سابق إذا لزم الأمر.
يمثل استخدام نموذج واحد فقط في تطبيق الإنتاج عددًا من التحديات الصعبة. إن MLOps هي طريقة منظمة وقابلة للتكرار تعتمد على الأدوات والتكنولوجيا وأفضل الممارسات للتغلب على المشاكل التقنية أو التجارية التي تنشأ أثناء دورة حياة نموذج التعلم الآلي. تحافظ MLOps الناجحة على الكفاءة عبر فرق العمل التي تعمل على بناء نماذج الذكاء الاصطناعي ونشرها ومراقبتها وإعادة تدريبها والتحكم فيها واستخدامها في أنظمة الإنتاج.
لماذا تُعد عمليات التشغيل الآلي المتعددة ضرورية؟
كما هو موضح في دورة حياة نموذج التعلم الآلي أعلاه، فإن بناء نموذج التعلم الآلي هو عملية تكرارية تتضمن دمج بيانات جديدة، وإعادة تدريب النماذج، والتعامل مع اضمحلال النموذج العام بمرور الوقت. هذه كلها مشاكل لا تعالجها عمليات المطورين التقليدية، أو DevOps، أو لا توفر حلولاً لها. لقد أصبحت عمليات التعلُّم الآلي ضرورية كوسيلة لإدارة الاستثمار في نماذج الذكاء الاصطناعي وضمان دورة حياة نموذجية منتجة. ولأن نماذج التعلّم الآلي ستتم الاستفادة منها من خلال مجموعة متنوعة من أنظمة الإنتاج المختلفة، فإن عمليات التشغيل الآلي للذكاء الاصطناعي تصبح جزءًا لا يتجزأ من التأكد من إمكانية تلبية المتطلبات عبر بيئات مختلفة ووسط سيناريوهات مختلفة.
02.jpg
يصور الرسم التوضيحي البسيط أعلاه نموذج تعلّم آلي يتم نشره في بيئة سحابية يغذي أحد التطبيقات. في هذا السيناريو الأساسي، يمكن أن ينشأ عدد من المشاكل التي تساعد عمليات التعلّم الآلي في التغلب عليها. نظرًا لأن تطبيق الإنتاج يعتمد على بيئة سحابية محددة، فهناك متطلبات زمن وصول لا يمكن لعلماء البيانات الذين طوروا نموذج التعلم الآلي الوصول إليها. ومن شأن تفعيل دورة حياة النموذج أن يتيح لعلماء البيانات أو المهندسين الذين لديهم معرفة عميقة بالنموذج تحديد المشاكل التي تنشأ في بيئات إنتاج محددة واستكشاف المشاكل التي تنشأ في بيئات إنتاج محددة وإصلاحها.
لا يقتصر الأمر على تدريب نماذج التعلم الآلي في بيئات مختلفة عن تطبيقات الإنتاج التي تُستخدم فيها فحسب، بل إنها تعتمد أيضًا في كثير من الأحيان على مجموعات بيانات تاريخية تختلف عن البيانات المستخدمة في تطبيقات الإنتاج. مع عمليات التعلّم الآلي الآلي يكون لدى فريق علوم البيانات بأكمله، بدءًا من أولئك الذين يطورون النموذج إلى الأشخاص الذين يعملون على مستوى التطبيق، وسيلة لمشاركة المعلومات والمساعدة وطلبها. إن المعدل الذي تتغير به البيانات والأسواق يجعل من الضروري أن يكون هناك أقل قدر ممكن من الاحتكاك بين جميع أصحاب المصلحة الرئيسيين والمساهمين الذين سيعتمدون على نموذج تعلم آلي معين.
دعم الانتقال إلى البرمجيات 2.0
البرمجيات2.0 هي الفكرة القائلة بأن تطوير البرمجيات سيشهد نقلة نوعية حيث يلعب الذكاء الاصطناعي دوراً محورياً متزايداً في كتابة نماذج الذكاء الاصطناعي التي تشغل تطبيقات البرمجيات. في إطار البرمجيات 1.0، يتضمن التطوير كتابة المبرمجين لتعليمات صريحة باستخدام لغة برمجة محددة (مثل Python و C+++). أما البرمجيات 2.0 فهي أكثر تجريداً بكثير. على الرغم من أن الأشخاص يوفرون بيانات الإدخال ويحددون المعلمات، إلا أنه يصعب على البشر فهم الشبكات العصبية بسبب تعقيدها الهائل - حيث تحتوي الشبكات النموذجية على ملايين الأوزان التي تؤثر على النتائج (وأحيانًا مليارات أو تريليونات).
تم بناء DevOps على أساس الاعتماد على البرمجيات 1.0 التي تعتمد على تعليمات محددة يمليها المبرمجون باستخدام اللغات، ولكنها لم تأخذ بعين الاعتبار دورة حياة نموذج التعلم الآلي الذي يشغل مجموعة متنوعة من التطبيقات المختلفة. تعالج MLOps الحاجة إلى أن تتغير عملية إدارة تطوير البرمجيات جنبًا إلى جنب مع البرمجيات قيد التطوير. ومع تحول البرمجيات 2.0 إلى المعيار الجديد لحل المشكلات القائمة على الحاسوب، فإن امتلاك الأدوات والعمليات الصحيحة لإدارة دورات حياة النموذج سيؤدي إلى نجاح أو فشل الاستثمارات في التكنولوجيا الجديدة. ميلفوس هو محرك بحث عن التشابه المتجه مفتوح المصدر تم تصميمه لدعم الانتقال إلى البرمجيات 2.0 وإدارة دورات حياة النموذج باستخدام MLOps.
03.jpg
تشغيل الذكاء الاصطناعي على نطاق واسع مع Milvus
Milvus عبارة عن منصة لإدارة البيانات المتجهة صُممت خصيصًا لتخزين مجموعات البيانات المتجهة الضخمة التي يبلغ حجمها تريليون بيانات، والاستعلام عنها وتحديثها وصيانتها. تعمل المنصة على تشغيل البحث عن تشابه المتجهات ويمكن أن تتكامل مع مكتبات الفهرسة المعتمدة على نطاق واسع، بما في ذلك Faiss وNMSLIB وAnnoy. من خلال إقران نماذج الذكاء الاصطناعي التي تحوّل البيانات غير المهيكلة إلى متجهات مع Milvus، يمكن إنشاء تطبيقات تشمل تطوير الأدوية الجديدة والتحليل البيومتري وأنظمة التوصيات وغير ذلك الكثير.
البحث عن التشابه المتجه هو الحل الأمثل لمعالجة البيانات غير المهيكلة وتحليلها، وتظهر البيانات المتجهة بسرعة كنوع أساسي من البيانات. يسهّل نظام إدارة البيانات الشامل مثل ميلفوس تفعيل الذكاء الاصطناعي بعدة طرق، بما في ذلك:
توفير بيئة لتدريب النماذج تضمن إجراء المزيد من جوانب التطوير في مكان واحد، وتسهيل التعاون بين الفرق، وحوكمة النماذج، وغير ذلك.
تقديم مجموعة شاملة من واجهات برمجة التطبيقات التي تدعم أطر العمل الشائعة مثل Python وJava وGo، مما يسهل دمج مجموعة مشتركة من نماذج تعلّم الآلة.
التوافق مع Google Colaboratory، وهي بيئة دفتر ملاحظات Jupyter التي تعمل في المتصفح، مما يبسّط عملية تجميع Milvus من التعليمات البرمجية المصدرية وتشغيل عمليات Python الأساسية.
تتيح وظيفة التعلُّم الآلي الآلي (AutoML) إمكانية أتمتة المهام المرتبطة بتطبيق التعلُّم الآلي على مشاكل العالم الحقيقي. لا تؤدي وظيفة AutoML إلى تحسينات في الكفاءة فحسب، بل إنها تتيح لغير الخبراء الاستفادة من نماذج وتقنيات التعلم الآلي.
بغض النظر عن تطبيقات التعلّم الآلي التي تقوم ببنائها اليوم، أو الخطط التي لديك للتطبيقات في المستقبل، فإن Milvus عبارة عن منصة مرنة لإدارة البيانات تم إنشاؤها مع وضع برنامج 2.0 وعمليات التعلّم الآلي في الاعتبار. لمعرفة المزيد عن Milvus أو تقديم مساهمات، يمكنك العثور على المشروع على Github. للمشاركة مع المجتمع أو طرح الأسئلة، انضم إلى قناة Slack الخاصة بنا. هل أنت متعطش لمزيد من المحتوى؟ اطلع على الموارد التالية:
Try Managed Milvus for Free
Zilliz Cloud is hassle-free, powered by Milvus and 10x faster.
Get StartedLike the article? Spread the word