文字轉圖像搜尋引擎
本教學示範如何使用開放原始碼向量資料庫 Milvus 建立文字轉影像搜尋引擎。
您可以按照基本教學快速建立一個最低限度可行的文字轉圖像搜尋引擎。另外,您也可以閱讀深入教學,其中涵蓋了從模型選擇到服務部署的所有內容。您可以按照深入教學中的指示,建立更進階的文字到影像搜尋引擎,以滿足您自己的業務需求。
使用的 ML 模型和第三方軟體包括
如今,傳統的文字搜尋引擎已逐漸失去魅力,越來越多的人將 TikTok 視為他們最愛的搜尋引擎。在傳統的文字搜尋中,人們輸入關鍵字,就會顯示所有包含該關鍵字的文字。然而,人們抱怨在這樣的搜尋中總是找不到他們想要的東西。此外,搜尋結果也不夠直覺。人們說他們覺得圖片和視訊要比爬行文字來得更直覺和愉快。跨模式文字到圖像的搜尋引擎因此而出現。有了這種新型的搜尋引擎,人們只需輸入一些關鍵字的大段文字,就能找到相關的圖片。
在本教程中,您將學習如何建立文字到圖像的搜尋引擎。本教學使用 CLIP 模型來擷取影像的特徵,並將其轉換成向量。然後將這些影像向量儲存在 Milvus 向量資料庫中。當使用者輸入查詢文字時,這些文字也會使用相同的 ML 模型 CLIP 轉換成嵌入向量。之後,Milvus 會執行向量相似性搜尋,擷取與輸入文字向量最相似的影像向量。
文字圖像搜尋