تصنيف تسلسل الحمض النووي
يوضح هذا البرنامج التعليمي كيفية استخدام Milvus، قاعدة بيانات المتجهات مفتوحة المصدر، لبناء نموذج تصنيف تسلسل الحمض النووي.
يتضمن نموذج التعلم الآلي وبرامج الطرف الثالث المستخدمة:
- CountVectorizer
- MySQL
- تاهي
تسلسل الحمض النووي مفهوم شائع في تتبع الجينات، وتحديد الأنواع، وتشخيص الأمراض، والعديد من المجالات الأخرى. في حين أن جميع الصناعات تتوق إلى طريقة بحث أكثر ذكاءً وكفاءةً، فقد اجتذب الذكاء الاصطناعي الكثير من الاهتمام خاصةً في المجالات البيولوجية والطبية. يساهم المزيد والمزيد من العلماء والباحثين في التعلم الآلي والتعلم العميق في مجال المعلوماتية الحيوية. ولجعل النتائج التجريبية أكثر إقناعًا، يتمثل أحد الخيارات الشائعة في زيادة حجم العينة. يجلب التعاون مع البيانات الضخمة في علم الجينوم المزيد من إمكانيات التطبيق في الواقع. ومع ذلك، فإن محاذاة التسلسل التقليدي لها قيود، مما يجعلها غير مناسبة لمجموعات البيانات الكبيرة. من أجل إجراء مفاضلة أقل في الواقع، يعد التحويل خيارًا جيدًا لمجموعة بيانات كبيرة من تسلسلات الحمض النووي.
ستتعلم في هذا البرنامج التعليمي كيفية بناء نموذج تصنيف تسلسل الحمض النووي. يستخدم هذا البرنامج التعليمي CountVectorizer لاستخراج سمات تسلسلات الحمض النووي وتحويلها إلى متجهات. بعد ذلك، يتم تخزين هذه المتجهات في Milvus ويتم تخزين فئات الحمض النووي المقابلة لها في MySQL. يمكن للمستخدمين إجراء بحث عن تشابه المتجهات في Milvus واستدعاء تصنيف الحمض النووي المقابل من MySQL.
الحمض النووي