GPU_IVF_FLAT
فهرس GPU_IVF_FLAT هو نسخة مسرعة من فهرس IVF_FLAT، وهو مصمم حصريًا لبيئات GPU. وهو يقسم بيانات المتجهات إلى nlist وحدات عنقودية ويحسب التشابه من خلال مقارنة متجه الاستعلام المستهدف أولاً بمركز كل مجموعة. من خلال ضبط المعلمة nprobe ، يتم البحث عن المجموعات الواعدة فقط، مما يقلل من وقت الاستعلام مع الحفاظ على التوازن بين الدقة والسرعة. لمزيد من المعلومات حول المفاهيم التأسيسية، راجع IVF_FLAT.
إنشاء فهرس
لإنشاء فهرس GPU_IVF_FLAT على حقل متجه في ميلفوس، استخدم طريقة add_index() ، مع تحديد index_type و metric_type ومعلمات إضافية للفهرس.
from pymilvus import MilvusClient
# Prepare index building params
index_params = MilvusClient.prepare_index_params()
index_params.add_index(
field_name="your_vector_field_name", # Name of the vector field to be indexed
index_type="GPU_IVF_FLAT", # Type of the index to create
index_name="vector_index", # Name of the index to create
metric_type="L2", # Metric type used to measure similarity
params={
"nlist": 1024, # Number of clusters for the index
} # Index building params
)
في هذا التكوين
index_type: نوع الفهرس المراد إنشاؤه. في هذا المثال، اضبط القيمة علىGPU_IVF_FLAT.metric_type: الطريقة المستخدمة لحساب المسافة بين المتجهات. للحصول على التفاصيل، راجع أنواع المقاييس.params: : خيارات التكوين الإضافية لبناء الفهرس.nlist: عدد المجموعات لتقسيم مجموعة البيانات.
لمعرفة المزيد من معلمات البناء المتوفرة للفهرس
GPU_IVF_FLAT، راجع بارامز بناء الفهرس.
بمجرد تكوين معلمات الفهرس، يمكنك إنشاء الفهرس باستخدام الأسلوب create_index() مباشرةً أو تمرير بارامترات الفهرس في الأسلوب create_collection. لمزيد من التفاصيل، راجع إنشاء مجموعة.
البحث في الفهرس
بمجرد إنشاء الفهرس وإدراج الكيانات، يمكنك إجراء عمليات بحث عن التشابه على الفهرس.
search_params = {
"params": {
"nprobe": 10, # Number of clusters to search
}
}
res = MilvusClient.search(
collection_name="your_collection_name", # Collection name
anns_field="vector_field",
data=[[0.1, 0.2, 0.3, 0.4, 0.5]], # Query vector
limit=3, # TopK results to return
search_params=search_params
)
في هذا التكوين
params: خيارات التكوين الإضافية للبحث على الفهرس.nprobe: عدد المجموعات المطلوب البحث عنها.
لمعرفة المزيد من معلمات البحث المتوفرة للفهرس
GPU_IVF_FLAT، راجع باراميات البحث الخاصة بالفهرس.
بارامترات الفهرس
يقدم هذا القسم نظرة عامة على المعلمات المستخدمة لبناء الفهرس وإجراء عمليات البحث على الفهرس.
معلمات بناء الفهرس
يسرد الجدول التالي المعلمات التي يمكن تكوينها في params عند إنشاء فهرس.
المعلمة |
الوصف |
نطاق القيمة |
اقتراح الضبط |
|---|---|---|---|
|
عدد العناقيد المراد إنشاؤها باستخدام خوارزمية k-means أثناء بناء الفهرس. يخزن كل عنقود، ممثلاً بنقطة مركزية، قائمة من المتجهات. تؤدي زيادة هذه المعلمة إلى تقليل عدد المتجهات في كل مجموعة، مما يؤدي إلى إنشاء أقسام أصغر وأكثر تركيزًا. |
النوع: عدد صحيح المدى: [1, 65536] القيمة الافتراضية: |
تعمل القيم الأكبر |
بارامترات البحث الخاصة بالفهرس
يسرد الجدول التالي المعلمات التي يمكن تكوينها في search_params.params عند البحث في الفهرس.
المعلمة |
الوصف |
نطاق القيمة |
اقتراح الضبط |
|---|---|---|---|
|
عدد العناقيد للبحث عن المرشحين. تسمح القيم الأعلى بالبحث عن المزيد من العناقيد، مما يحسن الاستدعاء من خلال توسيع نطاق البحث ولكن على حساب زيادة زمن انتقال الاستعلام. |
النوع: عدد صحيح المدى: [1, nlist] القيمة الافتراضية: |
تؤدي زيادة هذه القيمة إلى تحسين الاستدعاء ولكنها قد تؤدي إلى إبطاء البحث. قم بتعيين في معظم الحالات، نوصي بتعيين قيمة ضمن هذا النطاق: [1، nlist]. |