milvus-logo
LFAI
フロントページへ
  • チュートリアル

テキストから画像への検索エンジン

このチュートリアルでは、オープンソースのベクターデータベースであるMilvusを使って、テキストから画像への検索エンジンを構築する方法を紹介します。

基本的なチュートリアルに従うことで、最低限実行可能なテキスト画像検索エンジンを素早く構築することができます。また、モデルの選択からサービスのデプロイまで、すべてをカバーするディープ・ダイブ・チュートリアルもお読みください。ディープダイブ・チュートリアルの指示に従うことで、独自のビジネスニーズに対応した、より高度なテキスト画像検索エンジンを構築することができます。

使用したMLモデルとサードパーティソフトウェアは以下の通りです:

今日、伝統的なテキスト検索エンジンはその魅力を失いつつあり、より多くの人々がお気に入りの検索エンジンとしてTikTokを利用している。従来のテキスト検索では、キーワードを入力すると、そのキーワードを含むすべてのテキストが表示される。しかし、人々は、このような検索では常に自分の欲しいものを見つけることができないと不満を漏らしている。しかも、検索結果は直感的でない。人々は、テキストの行をクロールするよりも、画像や動画の方がずっと直感的で楽しいと言う。その結果、クロスモーダル検索エンジンが登場した。このような新しいタイプの検索エンジンを使えば、人々はキーワードのテキストの塊を入力することで、関連する画像を見つけることができる。

このチュートリアルでは、テキストから画像への検索エンジンを構築する方法を学びます。このチュートリアルでは、CLIP モデルを使って画像の特徴を抽出し、それをベクトルに変換します。そして、これらの画像ベクトルはMilvusベクトルデータベースに格納されます。ユーザがクエリテキストを入力すると、これらのテキストも同じMLモデルCLIPを用いて埋め込みベクトルに変換される。その後、Milvusでベクトル類似度検索が実行され、入力テキストベクトルに最も類似した画像ベクトルが検索される。

Text_image_search テキスト画像検索

翻訳DeepLogo

フィードバック

このページは役に立ちましたか ?