文本到图像搜索引擎
本教程演示了如何使用开源向量数据库 Milvus 构建文本到图像搜索引擎。
您可以按照基础教程快速构建一个最基本的文本到图像搜索引擎。或者,您也可以阅读深入教程,其中涵盖了从模型选择到服务部署的所有内容。您可以按照深层教程中的说明,建立一个更高级的文本到图像搜索引擎,以满足自己的业务需求。
使用的 ML 模型和第三方软件包括
如今,传统的文本搜索引擎正在失去魅力,越来越多的人将 TikTok 作为自己最喜爱的搜索引擎。在传统的文本搜索中,人们只需输入关键词,就会显示出所有包含该关键词的文本。然而,人们抱怨在这样的搜索中总是找不到自己想要的东西。此外,搜索结果也不够直观。人们说,他们觉得图片和视频要比一行行文字更直观、更令人愉悦。因此,跨模态文本到图像搜索引擎应运而生。有了这种新型搜索引擎,人们只需输入一段包含某些关键词的文字,就能找到相关的图片。
在本教程中,您将学习如何构建文本到图像搜索引擎。本教程使用 CLIP 模型提取图像的特征并将其转换为向量。然后将这些图像向量存储到 Milvus 向量数据库中。当用户输入查询文本时,这些文本也会使用相同的 ML 模型 CLIP 转换成嵌入向量。随后,在 Milvus 中执行向量相似性搜索,检索与输入文本向量最相似的图像向量。
文本图像搜索