ميسترال للذكاء الاصطناعي
نماذج التضمين منميسترال للذكاء الاصطناعي هي نماذج تضمين نصية مصممة لتحويل المدخلات النصية إلى متجهات رقمية كثيفة، مما يؤدي إلى التقاط المعنى الأساسي للنص بشكل فعال. وقد تم تحسين هذه النماذج بدرجة كبيرة لمهام مثل البحث الدلالي وفهم اللغة الطبيعية والتطبيقات المدركة للسياق، مما يجعلها مناسبة لمجموعة واسعة من الحلول التي تعمل بالذكاء الاصطناعي.
تتكامل Milvus مع نماذج التضمين الخاصة ب Mistral AI عبر فئة MistralAIEmbeddingFunction. توفر هذه الفئة طرقًا لترميز المستندات والاستعلامات باستخدام نماذج تضمين Mistral AI وإرجاع التضمينات كمتجهات كثيفة متوافقة مع فهرسة Milvus. للاستفادة من هذه الوظيفة، احصل على مفتاح API من Mistral AI.
لاستخدام هذه الميزة، قم بتثبيت التبعيات اللازمة:
pip install --upgrade pymilvus
pip install "pymilvus[model]"
ثم، قم بإنشاء وظيفة MistralAIEmbeddingFunction:
from pymilvus.model.dense import MistralAIEmbeddingFunction
ef = MistralAIEmbeddingFunction(
model_name="mistral-embed", # Defaults to `mistral-embed`
api_key="MISTRAL_API_KEY" # Provide your Mistral AI API key
)
المعلمات:
model_name
(سلسلة)اسم نموذج تضمين Mistral AI المراد استخدامه للترميز. القيمة الافتراضية إلى
mistral-embed
. لمزيد من المعلومات، راجع تضمينات.api_key
(سلسلة)مفتاح واجهة برمجة التطبيقات للوصول إلى واجهة برمجة تطبيقات Mistral AI.
لإنشاء تضمينات للمستندات، استخدم الأسلوب encode_documents()
:
docs = [
"Artificial intelligence was founded as an academic discipline in 1956.",
"Alan Turing was the first person to conduct substantial research in AI.",
"Born in Maida Vale, London, Turing was raised in southern England.",
]
docs_embeddings = ef.encode_documents(docs)
# Print embeddings
print("Embeddings:", docs_embeddings)
# Print dimension and shape of embeddings
print("Dim:", ef.dim, docs_embeddings[0].shape)
الناتج المتوقع مشابه لما يلي:
Embeddings: [array([-0.06051636, 0.03207397, 0.04684448, ..., -0.01618958,
0.02442932, -0.01302338]), array([-0.04675293, 0.06512451, 0.04290771, ..., -0.01454926,
0.0014801 , 0.00686646]), array([-0.05978394, 0.08728027, 0.02217102, ..., -0.00681305,
0.03634644, -0.01802063])]
Dim: 1024 (1024,)
لإنشاء تضمينات للاستعلامات، استخدم الأسلوب encode_queries()
:
queries = ["When was artificial intelligence founded",
"Where was Alan Turing born?"]
query_embeddings = ef.encode_queries(queries)
print("Embeddings:", query_embeddings)
print("Dim", ef.dim, query_embeddings[0].shape)
الناتج المتوقع مشابه لما يلي:
Embeddings: [array([-0.04916382, 0.04568481, 0.03594971, ..., -0.02653503,
0.02804565, 0.00600815]), array([-0.05938721, 0.07098389, 0.01773071, ..., -0.01708984,
0.03582764, 0.00366592])]
Dim 1024 (1024,)