🚀 جرب Zilliz Cloud، الـ Milvus المدارة بالكامل، مجاناً — تجربة أداء أسرع بـ 10 أضعاف! جرب الآن>>

milvus-logo
LFAI
الصفحة الرئيسية
  • المفاهيم
  • Home
  • Docs
  • المفاهيم

  • الهندسة المعمارية

  • التخزين/الحوسبة

فصل التخزين/الحوسبة

باتباع مبدأ الفصل بين مستوى البيانات ومستوى التحكم، تتألف Milvus من أربع طبقات مستقلة عن بعضها البعض من حيث قابلية التوسع والتعافي من الكوارث.

طبقة الوصول

تتألف طبقة الوصول من مجموعة من الوكلاء عديمي الحالة، وهي الطبقة الأمامية للنظام ونقطة النهاية للمستخدمين. تتحقق من صحة طلبات العميل وتقلل من النتائج التي يتم إرجاعها:

  • الوكيل في حد ذاته عديم الحالة. يوفر عنوان خدمة موحد باستخدام مكونات موازنة التحميل مثل Nginx و Kubernetes Ingress و NodePort و LVS.
  • نظرًا لأن Milvus يستخدم بنية معالجة متوازية على نطاق واسع (MPP)، يقوم الوكيل بتجميع النتائج الوسيطة ومعالجتها لاحقًا قبل إعادة النتائج النهائية إلى العميل.

خدمة المنسق

تقوم خدمة المنسق بتعيين المهام إلى العقد العاملة وتعمل كعقل النظام. وتشمل المهام التي تتولاها إدارة طوبولوجيا المجموعة، وموازنة التحميل، وتوليد الطابع الزمني، وإعلان البيانات، وإدارة البيانات.

هناك ثلاثة أنواع من المنسقين: منسق الجذر (منسق الجذر)، ومنسق البيانات (منسق البيانات)، ومنسق الاستعلام (منسق الاستعلام).

منسق الجذر (منسق الجذر)

يعالج منسق الجذر طلبات لغة تعريف البيانات (DDL) ولغة التحكم في البيانات (DCL)، مثل إنشاء مجموعات أو أقسام أو فهارس أو حذفها، بالإضافة إلى إدارة TSO (الطابع الزمني أوراكل) وإصدار شريط الوقت.

منسق الاستعلام (منسق الاستعلام)

يقوم منسق الاستعلام بإدارة الطوبولوجيا وموازنة التحميل لعقد الاستعلام، والتسليم من الأجزاء المتنامية إلى الأجزاء المغلقة.

منسق البيانات (منسق البيانات)

يدير منسق البيانات طوبولوجيا عقد البيانات وعقد الفهرس، ويحافظ على البيانات الوصفية ويحفز عمليات التدفق والضغط وبناء الفهرس وغيرها من عمليات البيانات في الخلفية.

عقد العمال

الأذرع والأرجل العقد العاملة هي عبارة عن منفّذات غبية تتبع التعليمات من خدمة المنسق وتنفذ أوامر لغة معالجة البيانات (DML) من الوكيل. العقد العاملة عديمة الحالة بفضل الفصل بين التخزين والحوسبة، ويمكنها تسهيل توسيع نطاق النظام واستعادة القدرة على العمل بعد الكوارث عند نشرها على Kubernetes. هناك ثلاثة أنواع من العقد العاملة:

عقدة الاستعلام

تسترجع عقدة الاستعلام بيانات السجل المتزايدة وتحولها إلى مقاطع متزايدة من خلال الاشتراك في وسيط السجل، وتحميل البيانات التاريخية من مخزن الكائنات، وتشغيل البحث الهجين بين البيانات المتجهة والقياسية.

عقدة البيانات

تسترجع عقدة البيانات بيانات السجل المتزايدة من خلال الاشتراك في وسيط السجل، وتعالج طلبات الطفرة، وتجمع بيانات السجل في لقطات السجل وتخزنها في مخزن الكائنات.

عقدة الفهرس

تقوم عقدة الفهرس ببناء الفهارس. لا تحتاج عقد الفهرس إلى أن تكون مقيمة في الذاكرة، ويمكن تنفيذها باستخدام إطار عمل بدون خادم.

التخزين

التخزين هو عظمة النظام، وهو المسؤول عن ثبات البيانات. ويتألف من التخزين التعريفي ووسيط السجل وتخزين الكائنات.

التخزين التعريفي

يخزّن التخزين التعريفي لقطات من البيانات الوصفية مثل مخطط المجموعة ونقاط التحقق من استهلاك الرسائل. يتطلب تخزين البيانات الوصفية توافرًا عاليًا للغاية واتساقًا قويًا ودعمًا للمعاملات، لذلك اختار Milvus موقع etcd للتخزين التعريفي. كما تستخدم ميلفوس أيضًا مخزن إلخd لتسجيل الخدمة والتحقق من صحتها.

تخزين الكائنات

يخزن تخزين الكائنات ملفات لقطات من السجلات، وملفات الفهرس للبيانات القياسية والمتجهة، ونتائج الاستعلام الوسيطة. يستخدم Milvus MinIO كتخزين كائنات ويمكن نشره بسهولة على AWS S3 و Azure Blob، وهما من أكثر خدمات التخزين شيوعًا وفعالية من حيث التكلفة في العالم. ومع ذلك، يتميز تخزين الكائنات بزمن وصول عالٍ ويتقاضى رسومًا حسب عدد الاستعلامات. ولتحسين أدائها وخفض التكاليف، تخطط ميلفوس لتنفيذ فصل البيانات الباردة عن الساخنة على ذاكرة أو تجمع ذاكرة تخزين مؤقت قائم على SSD.

وسيط السجل

وسيط السجل هو نظام فرعي يدعم التشغيل. وهو مسؤول عن استمرار تدفق البيانات والإخطار بالأحداث. كما يضمن سلامة البيانات الإضافية عند تعافي العقد العاملة من تعطل النظام. تستخدم مجموعة Milvus العنقودية نظام Pulsar كوسيط سجلات؛ بينما يستخدم نظام Milvus المستقل نظام RocksDB كوسيط سجلات. إلى جانب ذلك، يمكن استبدال وسيط السجل بسهولة بمنصات تخزين البيانات المتدفقة مثل Kafka.

تم بناء Milvus حول وسيط السجل ويتبع مبدأ "السجل كبيانات"، لذلك لا يحتفظ Milvus بجدول فعلي ولكنه يضمن موثوقية البيانات من خلال استمرار السجل وسجلات اللقطات.

Log_mechanism آلية_السجل

وسيط السجل هو العمود الفقري لميلفوس. وهو مسؤول عن ثبات البيانات وتجزئة القراءة والكتابة، وذلك بفضل آلية pub-sub الفطرية. يُظهر الرسم التوضيحي أعلاه تصويرًا مبسطًا للآلية، حيث ينقسم النظام إلى دورين، وسيط السجل (للحفاظ على تسلسل السجل) ومشترك السجل. يقوم الأول بتسجيل جميع العمليات التي تغير حالات التجميع؛ ويشترك الثاني في تسلسل السجل لتحديث البيانات المحلية ويقدم خدمات على شكل نسخ للقراءة فقط. تتيح آلية pub-sub أيضًا إمكانية توسيع النظام من حيث التقاط بيانات التغيير (CDC) والنشر الموزع عالميًا.

ما التالي

جرب Managed Milvus مجاناً

Zilliz Cloud خالي من المتاعب، ويعمل بواسطة Milvus ويعمل بسرعة 10 أضعاف.

ابدأ
التعليقات

هل كانت هذه الصفحة مفيدة؟