Mistral AI
Model penyematanMistral AI adalah model penyematan teks yang dirancang untuk mengubah input tekstual menjadi vektor numerik yang padat, yang secara efektif menangkap makna yang mendasari teks. Model-model ini sangat dioptimalkan untuk tugas-tugas seperti pencarian semantik, pemahaman bahasa alami, dan aplikasi yang sadar konteks, sehingga cocok untuk berbagai solusi bertenaga AI.
Milvus terintegrasi dengan model penyematan Mistral AI melalui kelas MistralAIEmbeddingFunction. Kelas ini menyediakan metode untuk menyandikan dokumen dan kueri menggunakan model penyematan AI Mistral dan mengembalikan penyematan sebagai vektor padat yang kompatibel dengan pengindeksan Milvus. Untuk menggunakan fungsi ini, dapatkan kunci API dari Mistral AI.
Untuk menggunakan fitur ini, instal dependensi yang diperlukan:
pip install --upgrade pymilvus
pip install "pymilvus[model]"
Kemudian, instal MistralAIEmbeddingFunction:
from pymilvus.model.dense import MistralAIEmbeddingFunction
ef = MistralAIEmbeddingFunction(
model_name="mistral-embed", # Defaults to `mistral-embed`
api_key="MISTRAL_API_KEY" # Provide your Mistral AI API key
)
Parameter:
model_name
(string)Nama model penyematan Mistral AI yang akan digunakan untuk pengkodean. Nilai defaultnya adalah
mistral-embed
. Untuk informasi lebih lanjut, lihat Penyematan.api_key
(string)Kunci API untuk mengakses API Mistral AI.
Untuk membuat penyematan untuk dokumen, gunakan metode encode_documents()
:
docs = [
"Artificial intelligence was founded as an academic discipline in 1956.",
"Alan Turing was the first person to conduct substantial research in AI.",
"Born in Maida Vale, London, Turing was raised in southern England.",
]
docs_embeddings = ef.encode_documents(docs)
# Print embeddings
print("Embeddings:", docs_embeddings)
# Print dimension and shape of embeddings
print("Dim:", ef.dim, docs_embeddings[0].shape)
Hasil yang diharapkan serupa dengan yang berikut ini:
Embeddings: [array([-0.06051636, 0.03207397, 0.04684448, ..., -0.01618958,
0.02442932, -0.01302338]), array([-0.04675293, 0.06512451, 0.04290771, ..., -0.01454926,
0.0014801 , 0.00686646]), array([-0.05978394, 0.08728027, 0.02217102, ..., -0.00681305,
0.03634644, -0.01802063])]
Dim: 1024 (1024,)
Untuk membuat sematan untuk kueri, gunakan metode encode_queries()
:
queries = ["When was artificial intelligence founded",
"Where was Alan Turing born?"]
query_embeddings = ef.encode_queries(queries)
print("Embeddings:", query_embeddings)
print("Dim", ef.dim, query_embeddings[0].shape)
Hasil yang diharapkan mirip dengan yang berikut ini:
Embeddings: [array([-0.04916382, 0.04568481, 0.03594971, ..., -0.02653503,
0.02804565, 0.00600815]), array([-0.05938721, 0.07098389, 0.01773071, ..., -0.01708984,
0.03582764, 0.00366592])]
Dim 1024 (1024,)