الكشف عن أفضل 10 كلمات رئيسية تهيمن على مجتمع ميلفوس في عام 2023
ونحن نختتم عام 2023، دعونا نستعرض رحلة مجتمع Milvus الرائعة: التفاخر بـ 25,000 نجم على GitHub، وإطلاق Milvus 2.3.0، وتجاوز 10 ملايين تنزيل لصور Docker. يستكشف هذا المنشور قلب المجتمع من خلال تحليل تاريخ الدردشة والكشف عن أهم 10 كلمات رئيسية في المناقشات.
#الإصدار رقم 1 - صعود شركة AIGC يقود التكرار السريع لـ Milvus
من المثير للدهشة أن كلمة "الإصدار" برزت كأكثر الكلمات المفتاحية التي نوقشت في عام 2023. هذا الكشف متجذر في موجة الذكاء الاصطناعي لهذا العام، مع قواعد البيانات المتجهة كبنية تحتية مهمة لمعالجة التحديات في مشاكل هلوسة تطبيقات AIGC.
يدفع الحماس حول قواعد البيانات المتجهة ميلفوس إلى مرحلة من التكرار السريع. فقد شهد المجتمع إصدار عشرين إصداراً في عام 2023 وحده، لتلبية متطلبات مطوري AIGC الذين أغرقوا المجتمع بالاستفسارات حول اختيار الإصدار الأمثل من Milvus لمختلف التطبيقات. بالنسبة للمستخدمين الذين يتنقلون بين هذه التحديثات، نوصي بتبني أحدث إصدار للحصول على ميزات وأداء محسّن.
إذا كنت مهتمًا بالتخطيط لإصدار Milvus، راجع صفحة خارطة طريق Milvus على الموقع الرسمي.
#2 البحث - ما بعد البحث المتجه
يحتل "البحث" المرتبة الثانية، مما يعكس دوره الأساسي في عمليات قاعدة البيانات. يدعم Milvus إمكانيات بحث متنوعة، من البحث في أعلى K ANN إلى البحث المصفى العددي والبحث في النطاق. يعد الإصدار الوشيك لـ Milvus 3.0 (بيتا) بالبحث بالكلمات الرئيسية (التضمينات المتفرقة)، وهو ما ينتظره العديد من مطوري تطبيقات RAG بفارغ الصبر.
تركز مناقشات المجتمع حول البحث على الأداء والإمكانيات والمبادئ. وغالبًا ما يطرح المستخدمون أسئلة حول تصفية السمات وتعيين قيم عتبة الفهرس ومعالجة مخاوف زمن الاستجابة. وقد أصبحت الموارد مثل وثائق الاستعلام والبحث، ومقترحات تحسينات ميلفوس (MEPs)، ومناقشات ديسكورد مراجع أساسية لكشف تعقيدات البحث داخل ميلفوس.
#3 الذاكرة - المفاضلة بين الأداء والدقة من أجل تقليل العبء على الذاكرة
احتلت "الذاكرة" أيضًا مركز الصدارة في مناقشات المجتمع خلال العام الماضي. كنوع مميز من البيانات، فإن المتجهات بطبيعتها ذات أبعاد عالية. يعد تخزين المتجهات في الذاكرة ممارسة شائعة لتحقيق الأداء الأمثل، لكن حجم البيانات المتصاعد يحد من الذاكرة المتاحة. يعمل Milvus على تحسين استخدام الذاكرة من خلال اعتماد تقنيات مثل MMap وDiskANN.
ومع ذلك، يظل تحقيق استخدام منخفض للذاكرة وأداء ممتاز ودقة عالية في وقت واحد في نظام قاعدة البيانات أمرًا معقدًا، مما يستلزم المفاضلة بين الأداء والدقة لتقليل النفقات الزائدة للذاكرة.
في حالة المحتوى المُنشأ بالذكاء الاصطناعي (AIGC)، عادةً ما يعطي المطورون الأولوية للاستجابات السريعة ودقة النتائج على متطلبات الأداء الصارمة. تعمل إضافة Milvus لـ MMap وDiskANN على تقليل استخدام الذاكرة مع زيادة معالجة البيانات ودقة النتائج إلى أقصى حد، مما يحقق التوازن الذي يتماشى مع الاحتياجات العملية لتطبيقات AIGC.
#4 إدراج - الإبحار السلس من خلال إدراج البيانات
يعد الإدراج الفعال للبيانات مصدر قلق كبير للمطورين، مما يثير مناقشات متكررة حول تحسين سرعة الإدراج داخل مجتمع Milvus. تتفوق Milvus في الإدراج الفعال للبيانات المتدفقة وبناء الفهارس، وذلك بفضل فصلها البارع للبيانات المتدفقة والبيانات المجمعة. هذه القدرة تميزه كحل عالي الأداء مقارنةً بمزودي قواعد البيانات المتجهة الآخرين، مثل Pinecone.
فيما يلي بعض الأفكار والتوصيات القيمة حول عمليات إدراج البيانات:
الإدراج على دفعات: اختر الإدراج على دفعات بدلاً من الإدراج من صف واحد لتحسين الكفاءة. والجدير بالذكر أن الإدراج من الملفات يفوق الإدراج الدفعي في السرعة. عند التعامل مع مجموعات البيانات الكبيرة التي تتجاوز عشرة ملايين سجل، ضع في اعتبارك استخدام واجهة
bulk_insert
لعملية استيراد مبسطة وسريعة.الاستخدام الاستراتيجي
flush()
: بدلًا من استدعاء الواجهةflush()
بعد كل دفعة، قم بإجراء استدعاء واحد بعد الانتهاء من إدخال جميع البيانات. يمكن أن يؤدي الاستخدام المفرط للواجهةflush()
بين الدفعات إلى توليد ملفات مجزأة مجزأة، مما يضع عبئًا كبيرًا على النظام.إلغاء تكرار المفتاح الأساسي: لا يقوم ميلفوس بإلغاء تكرار المفتاح الأساسي عند استخدام واجهة
insert
لإدخال البيانات. إذا كنت بحاجة إلى إلغاء تكرار المفاتيح الأساسية، نوصيك بنشر الواجهةupsert
. ومع ذلك، فإن أداء الإدراج فيupsert
أقل من أداءinsert
، بسبب عملية استعلام داخلية إضافية.
#5 التكوين - فك تشفير متاهة المعلمات
Milvus عبارة عن قاعدة بيانات متجهة موزعة تدمج العديد من مكونات الطرف الثالث مثل تخزين الكائنات وقوائم انتظار الرسائل و إلخ. تصارع المستخدمون مع تعديل المعلمات وفهم تأثيرها على أداء ميلفوس مما جعل "التكوين" موضوعًا متكررًا للنقاش.
من بين جميع الأسئلة حول التكوينات، يمكن القول إن "المعلمات التي يجب تعديلها" هي الجانب الأكثر تحديًا، حيث تختلف المعلمات باختلاف المواقف. على سبيل المثال، يختلف تحسين معلمات أداء البحث عن تحسين معلمات أداء الإدراج ويعتمد بشكل كبير على الخبرة العملية.
وبمجرد أن يحدد المستخدمون "المعلمات التي يجب ضبطها"، تصبح الأسئلة اللاحقة حول "كيفية الضبط" أكثر قابلية للإدارة. للاطلاع على إجراءات محددة، ارجع إلى وثائقنا "تكوين ميلفوس". الخبر السار هو أن Milvus قد دعم تعديلات المعلمات الديناميكية منذ الإصدار 2.3.0، مما يلغي الحاجة إلى إعادة التشغيل حتى تدخل التغييرات حيز التنفيذ. للحصول على إجراءات محددة، ارجع إلى تكوين Milvus أثناء التنقل.
#6 السجلات - التنقل في بوصلة استكشاف الأخطاء وإصلاحها
تعمل "السجلات" كبوصلة لاستكشاف الأخطاء وإصلاحها. طلب المستخدمون إرشادات في المجتمع حول تصدير سجلات ميلفوس، وضبط مستويات السجلات، والتكامل مع أنظمة مثل Loki من Grafana. فيما يلي بعض الاقتراحات حول سجلات ميلفوس.
كيفية عرض وتصدير سجلات ملفوس: يمكنك تصدير سجلات ميلفوس بسهولة باستخدام النص البرمجي تصدير سجلات ميلفوس بنقرة واحدة والمتوفر على مستودع GitHub.
مستوى السجل: لدى ميلفوس مستويات سجلات متعددة لاستيعاب حالات الاستخدام المتنوعة. مستوى المعلومات كافٍ لمعظم الحالات، أما مستوى التصحيح فهو مخصص لتصحيح الأخطاء. قد يشير وجود فائض في سجلات ميلفوس إلى وجود مستويات سجلات خاطئة.
نوصي بدمج سجلات Milvus مع نظام تجميع السجلات مثل Loki لاسترجاع السجلات بشكل مبسط في استكشاف الأخطاء وإصلاحها في المستقبل.
#7 الكتلة - التوسع في بيئات الإنتاج
نظرًا لهوية ميلفوس كقاعدة بيانات متجهة موزعة، فإن مصطلح "الكتلة" هو موضوع متكرر للنقاش في المجتمع. تدور المناقشات حول توسيع نطاق البيانات في المجموعة وترحيل البيانات والنسخ الاحتياطي للبيانات ومزامنتها.
في بيئات الإنتاج، تعد قابلية التوسع القوية والتوافر العالي من المتطلبات القياسية لأنظمة قواعد البيانات الموزعة. تسمح بنية الفصل بين التخزين والحوسبة في ميلفوس بقابلية التوسع السلس للبيانات من خلال توسيع الموارد لعقد الحوسبة والتخزين، واستيعاب مقاييس بيانات غير محدودة. يوفر Milvus أيضًا توافرًا عاليًا من خلال بنية متعددة النسخ وإمكانيات النسخ الاحتياطي والمزامنة القوية. لمزيد من المعلومات، راجع المنسق HA.
#8 التوثيق - البوابة لفهم ميلفوس
"التوثيق" هي كلمة رئيسية أخرى تثار بشكل متكرر في مناقشات المجتمع، وغالبًا ما ترتبط بأسئلة حول ما إذا كانت هناك أي صفحة توثيق لميزة معينة ومكان العثور عليها.
وباعتبارها البوابة لفهم ميلفوس، فإن حوالي 80% من استفسارات المجتمع تجد إجاباتها في الوثائق الرسمية. نوصيك بقراءة وثائقنا قبل استخدام ميلفوس أو مواجهة أي مشاكل. بالإضافة إلى ذلك، يمكنك استكشاف أمثلة التعليمات البرمجية في مستودعات SDK المختلفة للحصول على رؤى حول استخدام ملفوس.
النشر #9 النشر - تبسيط رحلة ميلفوس
يظل النشر البسيط هدف فريق ميلفوس المستمر. للوفاء بهذا الالتزام، قدمنا Milvus Lite، وهو بديل خفيف الوزن ل Milvus يعمل بكامل طاقته ولكن لا يحتوي على K8s أو تبعيات Docker.
قمنا بتبسيط عملية النشر بشكل أكبر من خلال تقديم حل المراسلة NATS الأخف وزنًا ودمج مكونات العقدة. واستجابةً لتعليقات المستخدمين، نستعد لإصدار إصدار مستقل بدون تبعيات، مع بذل جهود مستمرة لتحسين الميزات وتبسيط عمليات النشر. يُظهر التكرار السريع لـ Milvus التزام المجتمع المستمر بالتحسين المستمر لعملية النشر.
#10 الحذف - الكشف عن الأثر
تدور المناقشات السائدة حول "الحذف" حول عدم تغير عدد البيانات بعد الحذف، واستمرار إمكانية استرجاع البيانات المحذوفة، وفشل استرداد مساحة القرص بعد الحذف.
يقدم ميلفوس 2.3 تعبير count(*)
لمعالجة تحديثات عدد الكيانات المتأخرة. ربما يرجع استمرار البيانات المحذوفة في الاستعلامات إلى الاستخدام غير المناسب لنماذج اتساق البيانات. تدفع مخاوف فشل استرداد مساحة القرص إلى رؤى حول إعادة تصميم آلية جمع القمامة في Milvus، والتي تحدد فترة انتظار قبل الحذف الكامل للبيانات. يتيح هذا النهج نافذة زمنية للاسترداد المحتمل.
الخلاصة
تقدم أفضل 10 كلمات رئيسية لمحة عن المناقشات النابضة بالحياة داخل مجتمع ميلفوس. مع استمرار تطور Milvus، يظل المجتمع موردًا لا يقدر بثمن للمطورين الذين يبحثون عن حلول ومشاركة الخبرات والمساهمة في تطوير قواعد البيانات المتجهة في عصر الذكاء الاصطناعي.
انضم إلى هذه الرحلة المثيرة من خلال الانضمام إلى قناة Discord الخاصة بنا في عام 2024. هناك، يمكنك التفاعل مع مهندسينا اللامعين والتواصل مع عشاق Milvus ذوي التفكير المماثل. يمكنك أيضًا حضور غداء وتعلم مجتمع Milvus كل يوم ثلاثاء من الساعة 12:00 إلى 12:30 ظهرًا بتوقيت المحيط الهادي. شارك بأفكارك وأسئلتك وملاحظاتك، حيث أن كل مساهمة تضيف إلى الروح التعاونية التي تدفع ميلفوس إلى الأمام. مشاركتك الفعالة ليست فقط موضع ترحيب، بل هي موضع تقدير. لنبتكر معًا!
- #الإصدار رقم 1 - صعود شركة AIGC يقود التكرار السريع لـ Milvus
- #2 البحث - ما بعد البحث المتجه
- #3 الذاكرة - المفاضلة بين الأداء والدقة من أجل تقليل العبء على الذاكرة
- #4 إدراج - الإبحار السلس من خلال إدراج البيانات
- #5 التكوين - فك تشفير متاهة المعلمات
- #6 السجلات - التنقل في بوصلة استكشاف الأخطاء وإصلاحها
- #7 الكتلة - التوسع في بيئات الإنتاج
- #8 التوثيق - البوابة لفهم ميلفوس
- النشر #9 النشر - تبسيط رحلة ميلفوس
- #10 الحذف - الكشف عن الأثر
- الخلاصة
On This Page
Try Managed Milvus for Free
Zilliz Cloud is hassle-free, powered by Milvus and 10x faster.
Get StartedLike the article? Spread the word