المصطلحات

المعرف التلقائي

المعرف التلقائي هو سمة من سمات الحقل الأساسي التي تحدد ما إذا كان سيتم تمكين التعيين التلقائي للحقل الأساسي. يتم تحديد قيمة المعرف التلقائي بناءً على الطابع الزمني. لمزيد من المعلومات، ارجع إلى create_schema.

الفهرس التلقائي

يقرر Milvus تلقائيًا نوع الفهرس الأنسب والبارامترات لحقل معين بناءً على البيانات التجريبية. يعد هذا الأمر مثاليًا للحالات التي لا تحتاج فيها إلى التحكم في بارامترات الفهرس المحددة. لمزيد من المعلومات، راجع إضافة_فهرس.

أتو

Attu هي أداة إدارة شاملة لـ Milvus تقلل بشكل كبير من تعقيد وتكلفة إدارة النظام.

بيردواتشر

Birdwatcher هي أداة لتصحيح الأخطاء لـ Milvus تتصل بـ etcd، مما يسمح لك بمراقبة حالة خادم Milvus وإجراء التعديلات في الوقت الفعلي. كما أنها تدعم النسخ الاحتياطية لملفات إلخd، مما يساعد المطورين في استكشاف الأخطاء وإصلاحها.

الكاتب بالجملة

الكاتب بالجملة هي أداة معالجة البيانات التي توفرها حزم تطوير البرمجيات Milvus SDKs (مثل PyMilvus وJava SDK)، وهي مصممة لتحويل مجموعات البيانات الأولية إلى تنسيق متوافق مع Milvus لاستيرادها بكفاءة.

الإدراج بالجملة

الإدراج المجمّع هو واجهة برمجة تطبيقات تعمل على تحسين أداء الكتابة من خلال السماح باستيراد ملفات متعددة في طلب واحد، مما يحسّن العمليات مع مجموعات البيانات الكبيرة.

الكاردينال

الكاردينال، الذي طورته Zilliz Cloud، هو خوارزمية بحث متجهية متطورة توفر جودة بحث وأداء لا مثيل لهما. وبفضل تصميمها المبتكر والتحسينات الشاملة التي أدخلت عليها، تتفوق Cardinal على Knowhere بعدة أضعاف إلى عدة مرات إلى حد كبير مع التعامل التكيفي مع سيناريوهات الإنتاج المتنوعة، مثل أحجام K المتفاوتة، والتصفية العالية، وتوزيعات البيانات المختلفة، وما إلى ذلك.

القناة

تستخدم ميلفوس نوعين من القنوات، قناة PC وقناة كجزء من بنية خدمة البث. تتوافق كل قناة PChannel مع دفق WAL تديره Woodpecker، بينما تتوافق كل قناة VChannel مع جزء في مجموعة. تدير خدمة التدفق هذه القنوات لضمان اتساق البيانات واستعادة البيانات من الأخطاء.

المجموعة

في ميلفوس، تكافئ المجموعة جدولاً في نظام إدارة قواعد البيانات العلائقية (RDBMS). المجموعات هي كائنات منطقية رئيسية تستخدم لتخزين الكيانات وإدارتها. لمزيد من المعلومات، راجع إدارة المجموعات.

التبعية

التبعية هي برنامج يعتمد عليه برنامج آخر للعمل. وتتضمن تبعيات ميلفوس etcd (تخزين البيانات الوصفية) وMinIO أو S3 (تخزين الكائنات) وPulsar (إدارة سجلات اللقطات). لمزيد من المعلومات، راجع إدارة التبعيات.

المخطط الديناميكي

يسمح لك المخطط الديناميكي بإدراج كيانات بحقول جديدة في مجموعة دون تعديل المخطط الحالي. وهذا يعني أنه يمكنك إدراج البيانات دون معرفة المخطط الكامل للمجموعة ويمكنك تضمين الحقول التي لم يتم تعريفها بعد. يمكنك تمكين هذه الإمكانية الخالية من المخطط عن طريق تمكين الحقل الديناميكي عند إنشاء مجموعة. لمزيد من المعلومات، راجع تمكين الحقل الديناميكي.

التضمينات

يوفر Milvus وظائف تضمين مضمنة تعمل مع موفري التضمين المشهورين. قبل إنشاء مجموعة في Milvus، يمكنك استخدام هذه الدوال لإنشاء تضمينات لمجموعات البيانات الخاصة بك، مما يسهل عملية إعداد البيانات وعمليات البحث المتجهة. لإنشاء تضمينات أثناء العمل، راجع استخدام نموذج PyMilvus لتوليد تضمينات نصية.

الكيان

يتكون الكيان من مجموعة من الحقول التي تمثل كائنات العالم الحقيقي. يتم تمثيل كل كيان في ميلفوس بمفتاح أساسي فريد.

يمكنك تخصيص المفاتيح الأساسية. إذا لم تقم بالتكوين يدويًا، يقوم Milvus تلقائيًا بتعيين المفتاح الأساسي للكيانات. إذا اخترت تخصيص المفتاح الأساسي، لاحظ أن Milvus لا يدعم إلغاء تكرار المفتاح الأساسي في الوقت الحالي. لذلك، يمكن أن تكون هناك مفاتيح أساسية مكررة في نفس المجموعة. لمزيد من المعلومات، راجع إدراج الكيانات.

الحقل

يكافئ الحقل في مجموعة Milvus عمود جدول في نظام إدارة المحتوى الرقمي RDBMS. يمكن أن تكون الحقول إما حقولًا قياسية للبيانات المهيكلة (مثل الأرقام والسلاسل)، أو حقولًا متجهة لتضمين المتجهات.

التصفية

يدعم Milvus التصفية العددية من خلال البحث باستخدام المسندات، مما يسمح لك بتحديد شروط التصفية ضمن الاستعلامات وعمليات البحث لتحسين النتائج.

يطبق البحث المصفى عوامل التصفية القياسية على عمليات البحث بالمتجهات، مما يسمح لك بتنقيح نتائج البحث بناءً على معايير محددة. لمزيد من المعلومات، راجع البحث المصفى.

البحث الهجين عبارة عن واجهة برمجة تطبيقات للبحث المختلط منذ الإصدار 2.4.0 من ميلفوس. يمكنك البحث في حقول متجهات متعددة ودمجها. بالنسبة للبحث المتجه المدمج مع تصفية الحقول القياسية، يشار إليه باسم "البحث المصفى". لمزيد من المعلومات، راجع البحث الهجين.

الفهرس

فهرس المتجهات هو بنية بيانات معاد تنظيمها مشتقة من البيانات الأولية التي يمكنها تسريع عملية البحث عن تشابه المتجهات بشكل كبير. يدعم ميلفوس مجموعة واسعة من أنواع الفهارس لكل من الحقول المتجهة والحقول القياسية. لمزيد من المعلومات، راجع أنواع فهرس المتجهات.

موصل كافكا- ميلفوس

يشير موصلKafka-Milvus Connect or إلى موصل بالوعة Kafka لميلفوس. يسمح لك بدفق البيانات المتجهة من كافكا إلى ميلفوس.

نوير

نوهير هو محرك التنفيذ المتجه الأساسي ل Milvus والذي يتضمن العديد من مكتبات البحث عن التشابه المتجه بما في ذلك Faiss و Hnswlib و Annoy. تم تصميم Knowhere أيضًا لدعم الحوسبة غير المتجانسة. فهو يتحكم في الأجهزة (وحدة المعالجة المركزية أو وحدة معالجة الرسومات) لتنفيذ طلبات بناء الفهرس والبحث. هكذا حصل نوير على اسمه - معرفة مكان تنفيذ العمليات.

لقطة السجل

لقطة السجل هي عبارة عن سجل ثنائي، وهو عبارة عن وحدة أصغر في المقطع الذي يسجل ويعالج التحديثات والتغييرات التي تم إجراؤها على البيانات في ملفوس. يتم تخزين البيانات من مقطع ما في سجلات ثنائية متعددة. هناك ثلاثة أنواع من السجلات الثنائية في ميلفوس: إدراج سجلات ثنائية وحذف سجلات ثنائية وحذف سجلات ثنائية. لمزيد من المعلومات، راجع التخزين الوصفي.

نوع القياس

تُستخدم أنواع مقاييس التشابه لقياس أوجه التشابه بين المتجهات. يدعم ميلفوس حاليًا المسافة الإقليدية (L2)، والضرب الداخلي (IP)، والتشابه في جيب التمام (COSINE)، وأنواع المقاييس الثنائية. يمكنك اختيار نوع المقياس الأنسب بناءً على السيناريو الخاص بك. لمزيد من المعلومات، راجع مقاييس التشابه.

MemoryBuffer

MemoryBuffer هو وضع نشر خفيف الوزن لنقار الخشب يقوم بتخزين الكتابات الواردة مؤقتًا في الذاكرة ويقوم بمسحها بشكل دوري إلى مخزن الكائنات السحابية. هذا الوضع هو الأنسب لأحمال العمل ذات الدُفعات الثقيلة في عمليات النشر على نطاق أصغر أو بيئات الإنتاج التي تعطي الأولوية للبساطة على الأداء. لمزيد من المعلومات، راجع بنية Woodpecker.

Mmap

تعمل الملفات المعينة بالذاكرة على تمكين معالجة البيانات بكفاءة من خلال تعيين محتويات الملف مباشرةً في الذاكرة. وهذا مفيد بشكل خاص عندما تكون الذاكرة محدودة وتحميل جميع البيانات غير ممكن. يمكن لهذه التقنية تعزيز سعة البيانات والحفاظ على الأداء إلى حد ما. ومع ذلك، إذا تجاوزت البيانات سعة الذاكرة بشكل كبير، فقد تنخفض سرعات البحث والاستعلام بشكل كبير. لمزيد من المعلومات، ارجع إلى تخزين البيانات الممكّنة لـ MM-ap.

ميلفوس النسخ الاحتياطي

Milvus Backup هو أداة لإنشاء نسخ من البيانات، والتي يمكن استخدامها لاستعادة النسخة الأصلية بعد حدث فقدان البيانات.

ميلفوس CDC

أداة MilvusCDC (التقاط بيانات التغيير) هي أداة سهلة الاستخدام يمكنها التقاط ومزامنة البيانات الإضافية في مثيلات Milvus. وهي تضمن موثوقية بيانات الأعمال من خلال نقلها بسلاسة بين مثيلات المصدر والهدف، مما يسمح بسهولة النسخ الاحتياطي التزايدي واستعادة البيانات بعد الكوارث.

واجهة أوامر Milvus CLI

واجهة سطر الأوامر Milvus (CLI) هي أداة سطر أوامر تدعم الاتصال بقاعدة البيانات وعمليات البيانات واستيراد البيانات وتصديرها. استنادًا إلى Milvus Python SDK، فهي تسمح بتنفيذ الأوامر من خلال محطة طرفية باستخدام مطالبات سطر الأوامر التفاعلية.

Milvus Migration

MilvusMigration هي أداة مفتوحة المصدر مصممة لتسهيل ترحيل البيانات بسهولة من مصادر بيانات مختلفة إلى Milvus 2.x.

مجموعة ميلفوس العنقودية

في النشر العنقودي ل Milvus، يتم توفير الخدمات من قبل مجموعة من العقد لتحقيق توافر عالٍ وقابلية توسع سهلة.

ميلفوس مستقل

في النشر المستقل ل Milvus، يتم إكمال جميع العمليات بما في ذلك إدراج البيانات، وبناء الفهرس، والبحث عن تشابه المتجهات في عملية واحدة.

متعدد المتجهات

يدعم Milvus حقول متجهات متعددة في مجموعة واحدة منذ الإصدار 2.4.0. لمزيد من المعلومات، راجع البحث المختلط.

التقسيم

التقسيم هو تقسيم مجموعة. يدعم Milvus تقسيم بيانات المجموعة إلى أجزاء متعددة على وحدة تخزين فعلية. وتسمى هذه العملية بالتقسيم، ويمكن أن يحتوي كل قسم على أجزاء متعددة. لمزيد من المعلومات، راجع إدارة الأقسام.

مفتاح التقسيم

تتيح سمة مفتاح التقسيم لحقل ما فصل الكيانات إلى أقسام متميزة بناءً على قيم مفتاح التقسيم الخاصة بها. يضمن هذا التجميع أن يتم تخزين الكيانات التي تتشارك نفس قيمة المفتاح معًا، مما يمكن أن يسرع من عمليات البحث من خلال السماح للنظام بتجاوز الأقسام غير ذات الصلة أثناء الاستعلامات التي تمت تصفيتها بواسطة حقل مفتاح التقسيم. لمزيد من المعلومات، راجع استخدام مفتاح التقسيم.

قناة PChannel

يرمز PChannel إلى القناة الفعلية. تتوافق كل قناة PChannel مع دفق WAL تتم إدارته بواسطة Woodpecker. بشكل افتراضي، سيتم تعيين مجموعة من قنوات PChannels لتخزين السجلات التي تسجل إدخال البيانات وحذفها وتحديثها عند بدء تشغيل مجموعة Milvus. لمزيد من المعلومات، راجع خدمة الدفق.

PyMilvus

PyMilvus هي مجموعة أدوات تطوير البرمجيات Python SDK لـ Milvus. شفرة المصدر الخاصة به مفتوحة المصدر ومستضافة على GitHub. لديك المرونة في اختيار MilvusClient (الإصدار الجديد من Python SDK) أو وحدة ORM الأصلية للتحدث مع Milvus.

الاستعلام

الاستعلام هو واجهة برمجة تطبيقات تجري تصفية عددية بتعبير منطقي محدد كمرشح. لمزيد من المعلومات، ارجع إلى الحصول على استعلام الاستعلام العددي.

QuorumBuffer

QuorumBuffer هو وضع نشر لنقار الخشب مصمم لأحمال عمل القراءة/الكتابة الحساسة لوقت الاستجابة وعالية التردد التي تتطلب استجابة في الوقت الحقيقي وتحملاً قوياً للأخطاء. وهو يعمل كمخزن مؤقت عالي السرعة للكتابة مع ثلاث نسخ للكتابة النصابية، مما يضمن اتساقًا قويًا وتوافرًا عاليًا. لمزيد من المعلومات، راجع Woodpecker Architecture.

يسمح لك البحث عن النطاق بالعثور على المتجهات التي تقع ضمن مسافة محددة من متجه البحث. لمزيد من المعلومات، راجع بحث النطاق.

المخطط

المخطط هو المعلومات الوصفية التي تحدد نوع البيانات وخصائص البيانات. تحتوي كل مجموعة على مخطط المجموعة الخاص بها والذي يحدد جميع حقول المجموعة، وتمكين التخصيص التلقائي للمعرف (المفتاح الأساسي)، ووصف المجموعة. يتم أيضًا تضمين مخططات الحقول في مخططات المجموعة، والتي تحدد الاسم ونوع البيانات والخصائص الأخرى للحقل. لمزيد من المعلومات، راجع إدارة المخطط.

البحث عبارة عن واجهة برمجة تطبيقات تقوم بإجراء عملية لإجراء بحث عن تشابه متجه، وتتطلب بيانات متجهية لتنفيذها. لمزيد من المعلومات، راجع بحث متجه واحد.

المقطع

المقطع عبارة عن ملف بيانات يتم إنشاؤه تلقائيًا ويخزن البيانات المدرجة. قد تحتوي المجموعة على عدة مقاطع، ويمكن أن يحتوي كل مقطع على العديد من الكيانات. أثناء البحث عن التشابه المتجه، يفحص ميلفوس كل مقطع لتجميع نتائج البحث.

هناك نوعان من المقاطع: المقاطع المتنامية والمختومة. يستمر المقطع المتنامي في جمع بيانات جديدة حتى يصل إلى حد معين أو حد زمني محدد، وبعد ذلك يصبح مغلقًا. بمجرد إغلاقه، لا يقبل المقطع بعد ذلك بيانات جديدة ويتم نقله إلى مخزن الكائنات. في هذه الأثناء، يتم توجيه البيانات الواردة إلى مقطع متزايد جديد. يتم تشغيل الانتقال من شريحة متنامية إلى شريحة مختومة إما عن طريق الوصول إلى حد الكيان المحدد مسبقًا أو عن طريق تجاوز الحد الأقصى للمدة المسموح بها في حالة النمو. لمزيد من المعلومات، راجع تفاصيل التصميم.

موصل Spark-Milvus Connector

يوفرموصل Spark-Milvus Connector تكاملاً سلساً بين Apache Spark و Milvus، حيث يجمع بين ميزات معالجة البيانات والتعلم الآلي (ML) في Apache Spark مع قدرات تخزين البيانات المتجهة وإمكانيات البحث في Milvus.

شارد

يعمل Milvus على تحسين أداء كتابة البيانات من خلال توزيع عمليات الكتابة عبر عقد متعددة باستخدام أجزاء يتم تنظيمها بناءً على تجزئة المفاتيح الأساسية. يستفيد هذا من قدرات الحوسبة المتوازية للمجموعة.

يعمل التقسيم على تقليل حمل القراءة عن طريق تحديد اسم القسم، بينما يعمل التجزئة على توزيع حمل الكتابة بين خوادم متعددة.

المتجهات المتفرقة

تمثل المتجهات المتفرقة الكلمات أو العبارات باستخدام تضمينات المتجهات حيث تكون معظم العناصر صفرية، مع وجود عنصر واحد فقط غير صفري يشير إلى وجود كلمة معينة. تتفوق نماذج المتجهات المتناثرة، مثل SPLADEv2، على النماذج الكثيفة في البحث عن المعرفة خارج النطاق، والوعي بالكلمات الرئيسية، وقابلية التفسير. لمزيد من المعلومات، راجع المتجهات المتفرقة.

خدمة البث

خدمة التدفق هي مفهوم لوحدة نظام التدفق الداخلي في ميلفوس المبنية حول سجل الكتابة الأمامية (WAL) لدعم مختلف الوظائف المتعلقة بالبث. وتشمل هذه الوظائف استيعاب/اشتراك البيانات المتدفقة، واسترداد الأخطاء لحالة المجموعة، وتحويل البيانات المتدفقة إلى بيانات تاريخية، والاستعلامات المتزايدة للبيانات. تتألف الخدمة من مكونات منسق البث، ومجموعة عقدة البث ومكونات عميل البث. لمزيد من المعلومات، راجع خدمة تدفق البيانات.

البيانات غير المهيكلة

البيانات غير المهيكلة، بما في ذلك الصور والفيديو والصوت واللغة الطبيعية، هي معلومات لا تتبع نموذجًا أو طريقة تنظيم محددة مسبقًا. ويمثل هذا النوع من البيانات حوالي 80% من البيانات في العالم، ويمكن تحويلها إلى متجهات باستخدام نماذج الذكاء الاصطناعي (AI) والتعلم الآلي المختلفة.

القناة الافتراضية

يرمز VChannel إلى القناة الافتراضية. تمثل كل قناة VChannel جزءًا في مجموعة. سيتم تعيين مجموعة من القنوات الافتراضية VChannel لكل مجموعة لتسجيل إدراج البيانات وحذفها وتحديثها. تكون قنوات VChannels منفصلة منطقيًا ولكنها تشترك فعليًا في الموارد من خلال خدمة البث. لمزيد من المعلومات، راجع خدمة البث.

المتجه

متجه التضمين هو تجريد ميزة للبيانات غير المهيكلة، مثل رسائل البريد الإلكتروني، وبيانات مستشعر إنترنت الأشياء، وصور Instagram، وبنى البروتين، وغيرها. من الناحية الرياضية، متجه التضمين هو عبارة عن مصفوفة من الأرقام ذات الفاصلة العائمة أو الثنائيات. تُستخدم تقنيات التضمين الحديثة لتحويل البيانات غير المنظمة إلى متجهات تضمين. يدعم ميلفوس كلاً من المتجهات الكثيفة والمتناثرة منذ الإصدار 2.4.0.

تخزين WAL

تخزين سجل الكتابة المسبق (WAL) هو أساس متانة البيانات واتساقها في الأنظمة الموزعة. قبل إجراء أي تغيير، يتم تسجيله أولاً في السجل - مما يضمن أنه في حالة حدوث عطل، يمكنك استرداد البيانات من حيث توقفت بالضبط. يستخدم ميلفوس Woodpecker كنظام تخزين WAL الخاص به، والذي يدعم وضعي MemoryBuffer و QuumorBuffer. لمزيد من المعلومات، راجع بنية Woodpecker.

نقار الخشب

Woodpecker هو نظام WAL سحابي أصلي في Milvus 2.6 يحل محل Kafka وPulsar. مع بنية خالية من الأقراص ونمطين للنشر (MemoryBuffer و QuorumBuffer)، فهو يوفر إنتاجية عالية ونفقات تشغيلية منخفضة وقابلية توسع سلسة على تخزين الكائنات. لمزيد من المعلومات، راجع بنية Woodpecker.

زيليز كلاود

Milvus مُدار بالكامل على Zilliz Cloud، مع المزيد من الميزات المؤسسية والأداء المحسّن للغاية.