الكشف عن Milvus 2.4: البحث متعدد المتجهات والمتجهات المتفرقة وفهرس CAGRA والمزيد!
يسعدنا أن نعلن عن إطلاق الإصدار Milvus 2.4، وهو تقدم كبير في تعزيز قدرات البحث لمجموعات البيانات واسعة النطاق. يضيف هذا الإصدار الأخير ميزات جديدة، مثل دعم فهرس CAGRA المستند إلى وحدة معالجة الرسومات (GPU)، والدعم التجريبي للتضمينات المتناثرة، والبحث الجماعي، والعديد من التحسينات الأخرى في قدرات البحث. تعزز هذه التطورات التزامنا تجاه المجتمع من خلال تقديم أداة قوية وفعالة للمطورين مثلك للتعامل مع البيانات المتجهة والاستعلام عنها. لننتقل معًا إلى المزايا الرئيسية لـ Milvus 2.4.
تمكين البحث متعدد المتجهات لعمليات بحث مبسطة متعددة الوسائط
يوفر Milvus 2.4 إمكانية البحث متعدد المتجهات، مما يسمح بالبحث المتزامن وإعادة ترتيب أنواع مختلفة من المتجهات داخل نظام Milvus نفسه. تعمل هذه الميزة على تبسيط عمليات البحث متعدد الوسائط، مما يعزز معدلات الاستدعاء بشكل كبير ويمكّن المطورين من إدارة تطبيقات الذكاء الاصطناعي المعقدة ذات أنواع البيانات المتنوعة دون عناء. بالإضافة إلى ذلك، تعمل هذه الوظيفة على تبسيط عملية التكامل والضبط الدقيق لنماذج إعادة الترتيب المخصصة، مما يساعد في إنشاء وظائف بحث متقدمة مثل أنظمة التوصية الدقيقة التي تستخدم رؤى من البيانات متعددة الأبعاد.
كيفية عمل ميزة البحث متعدد المتجهات في ميلفوس
يحتوي دعم المتجهات المتعددة في ميلفوس على عنصرين:
القدرة على تخزين/الاستعلام عن متجهات متعددة لكيان واحد داخل مجموعة، وهي طريقة أكثر طبيعية لتنظيم البيانات
القدرة على بناء/تحسين خوارزمية إعادة الترتيب من خلال الاستفادة من خوارزميات إعادة الترتيب المبنية مسبقًا في ميلفوس
إلى جانب كونها ميزة مطلوبة بشدة، قمنا ببناء هذه الإمكانية لأن الصناعة تتجه نحو النماذج متعددة الوسائط مع إصدار GPT-4 وClaude 3. إعادة الترتيب هي تقنية شائعة الاستخدام لزيادة تحسين أداء الاستعلام في البحث. كنا نهدف إلى تسهيل الأمر على المطورين لبناء وتحسين عمليات إعادة الترتيب الخاصة بهم داخل نظام Milvus البيئي.
دعم تجميع البحث من أجل تحسين كفاءة الحوسبة
تجميع البحث هو ميزة أخرى مطلوبة كثيرًا أضفناها إلى Milvus 2.4. فهو يدمج عملية تجميع حسب المجموعة المصممة للحقول من أنواع BOOL أو INT أو VARCHAR، مما يسد فجوة كفاءة حاسمة في تنفيذ استعلامات التجميع على نطاق واسع.
تقليديًا، كان المطورون يعتمدون على عمليات بحث واسعة النطاق من أعلى K متبوعة بمعالجة يدوية لاحقة لاستخلاص نتائج خاصة بالمجموعة، وهي طريقة تتطلب الكثير من الحوسبة وتتطلب الكثير من التعليمات البرمجية. يعمل البحث عن التجميع على تحسين هذه العملية من خلال ربط نتائج الاستعلام بكفاءة بمعرّفات المجموعات المجمّعة مثل أسماء المستندات أو مقاطع الفيديو، مما يسهّل التعامل مع الكيانات المجزأة ضمن مجموعات بيانات أكبر.
تميز Milvus عملية البحث التجميعي الخاصة بها من خلال تطبيق قائم على التكرار، مما يوفر تحسنًا ملحوظًا في الكفاءة الحسابية مقارنةً بالتقنيات المماثلة. يضمن هذا الاختيار قابلية فائقة للتوسع في الأداء، خاصةً في بيئات الإنتاج حيث يكون تحسين موارد الحوسبة أمرًا بالغ الأهمية. من خلال تقليل عبور البيانات والنفقات الحسابية الزائدة، يدعم Milvus معالجة استعلام أكثر كفاءة، مما يقلل بشكل كبير من أوقات الاستجابة والتكاليف التشغيلية مقارنة بقواعد البيانات المتجهة الأخرى.
يعزز تجميع البحث من قدرة Milvus على إدارة الاستعلامات المعقدة ذات الحجم الكبير والمعقدة ويتماشى مع ممارسات الحوسبة عالية الأداء لحلول إدارة البيانات القوية.
الدعم التجريبي لتضمينات المتجهات المتفرقة
تمثّلالتضمينات المتفرقة نقلة نوعية عن مناهج المتجهات الكثيفة التقليدية، حيث تلبي الفروق الدقيقة في التشابه الدلالي بدلاً من مجرد تكرار الكلمات الرئيسية. يسمح هذا التمييز بقدرة بحث أكثر دقة، بما يتماشى بشكل وثيق مع المحتوى الدلالي للاستعلام والمستندات. توفر نماذج المتجهات المتفرقة، المفيدة بشكل خاص في استرجاع المعلومات ومعالجة اللغات الطبيعية، قدرات بحث قوية خارج المجال وقابلية للتفسير مقارنةً بنظيراتها الكثيفة.
في الإصدار Milvus 2.4، قمنا بتوسيع نطاق البحث الهجين ليشمل التضمينات المتفرقة التي تم إنشاؤها بواسطة نماذج عصبية متقدمة مثل SPLADEv2 أو نماذج إحصائية مثل BM25. في Milvus، يتم التعامل مع المتجهات المتفرقة على قدم المساواة مع المتجهات الكثيفة، مما يتيح إنشاء مجموعات ذات حقول متجهات متناثرة، وإدراج البيانات، وبناء الفهرس، وإجراء عمليات البحث عن التشابه. وتجدر الإشارة إلى أن التضمينات المتفرقة في ميلفوس تدعم مقياس المسافة (IP) الخاص بالضرب الداخلي، وهو أمر مفيد نظرًا لطبيعتها عالية الأبعاد، مما يجعل المقاييس الأخرى أقل فعالية. تدعم هذه الوظيفة أيضًا أنواع البيانات ذات البُعد كعدد صحيح غير موقّع 32 بت، و 32 بت كعدد عائم للقيمة، مما يسهل مجموعة واسعة من التطبيقات، بدءًا من عمليات البحث النصية الدقيقة إلى أنظمة استرجاع المعلومات المعقدة.
مع هذه الميزة الجديدة، تسمح Milvus بمنهجيات البحث الهجينة التي تمزج بين الكلمات المفتاحية والتقنيات القائمة على التضمين، مما يوفر انتقالاً سلساً للمستخدمين الذين ينتقلون من أطر البحث التي تركز على الكلمات المفتاحية بحثاً عن حل شامل وقليل الصيانة.
نقوم بتسمية هذه الميزة بـ "بيتا" لمواصلة اختبار أداء الميزة وجمع الملاحظات من المجتمع. من المتوقع التوافر العام (GA) لدعم المتجهات المتفرقة مع إصدار Milvus 3.0.
دعم فهرس CAGRA لفهرسة الرسم البياني المعجل بوحدة معالجة الرسومات المتقدمة
تم تطوير CAGRA (CAGRA ) من قبل NVIDIA، وهي تقنية فهرسة الرسوم البيانية القائمة على وحدة معالجة الرسومات التي تتفوق بشكل كبير على الطرق التقليدية القائمة على وحدة المعالجة المركزية مثل فهرس HNSW من حيث الكفاءة والأداء، خاصةً في البيئات عالية الإنتاجية.
مع تقديم فهرس CAGRA، يوفر Milvus 2.4 إمكانية فهرسة الرسم البياني المعززة بوحدة معالجة الرسوم البيانية المعززة بوحدة معالجة الرسوم البيانية. ويُعد هذا التحسين مثاليًا لبناء تطبيقات البحث عن التشابه التي تتطلب الحد الأدنى من زمن الاستجابة. بالإضافة إلى ذلك، يدمج الإصدار Milvus 2.4 بحث القوة الغاشمة مع فهرس CAGRA لتحقيق أقصى معدلات استرجاع في التطبيقات. للحصول على رؤى مفصلة، استكشف مدونة مقدمة CAGRA.
ميلفوس رافت CAGRA مقابل ميلفوس HNSW
تحسينات وميزات إضافية
يتضمن Milvus 2.4 أيضًا تحسينات رئيسية أخرى، مثل دعم التعبير العادي لمطابقة السلاسل الفرعية المحسنة في تصفية البيانات الوصفية وفهرس مقلوب قياسي جديد لتصفية فعالة لنوع البيانات القياسية وأداة التقاط بيانات التغيير لمراقبة التغييرات في مجموعات Milvus وتكرارها. تعمل هذه التحديثات مجتمعة على تحسين أداء Milvus وتعدد استخداماته، مما يجعله حلاً شاملاً لعمليات البيانات المعقدة.
لمزيد من التفاصيل، راجع وثائق Milvus 2.4.
ابق على اتصال!
هل أنت متحمس لمعرفة المزيد عن Milvus 2.4؟ انضم إلى ندوتنا القادمة على الويب مع جيمس لوان، نائب رئيس قسم الهندسة في شركة Zilliz، لإجراء مناقشة متعمقة حول إمكانيات هذا الإصدار الأخير. إذا كانت لديك أسئلة أو ملاحظات، انضم إلى قناة Discord الخاصة بنا للتفاعل مع مهندسينا وأعضاء مجتمعنا. لا تنسَ متابعتنا على تويتر أو LinkedIn للحصول على آخر الأخبار والتحديثات حول Milvus.
- تمكين البحث متعدد المتجهات لعمليات بحث مبسطة متعددة الوسائط
- دعم تجميع البحث من أجل تحسين كفاءة الحوسبة
- الدعم التجريبي لتضمينات المتجهات المتفرقة
- دعم فهرس CAGRA لفهرسة الرسم البياني المعجل بوحدة معالجة الرسومات المتقدمة
- تحسينات وميزات إضافية
- ابق على اتصال!
On This Page
Try Managed Milvus for Free
Zilliz Cloud is hassle-free, powered by Milvus and 10x faster.
Get StartedLike the article? Spread the word