画像の重複排除
このチュートリアルでは、オープンソースのベクトルデータベースMilvusを使って画像重複排除システムを構築する方法を示します。
使用したMLモデルとサードパーティソフトウェアは以下の通りです:
ResNet-50
近年、ユーザー生成コンテンツが爆発的に増加している。人々は撮った写真を即座にソーシャルメディアにアップロードすることができる。しかし、そのような画像データが氾濫しているため、重複したコンテンツが多く見受けられる。ユーザーエクスペリエンスを向上させるためには、このような重複画像を削除しなければならない。画像重複排除システムは、データベース内の画像を1枚ずつ比較して重複画像を除外するという手作業から解放してくれる。まったく同じ画像を選び出すことは、まったく複雑な作業ではない。しかし、画像を拡大したり、トリミングしたり、明るさやグレースケールを調整したりすることもある。画像重複除去システムは、このような類似画像を識別し、それらも除去する必要があります。
このチュートリアルでは、画像重複排除システムの構築方法を学びます。このチュートリアルでは、ResNet-50 モデルを使って画像の特徴を抽出し、それをベクトルに変換します。そして、これらの画像ベクトルをMilvusベクトルデータベースに格納し、Milvusでベクトルの類似検索も行います。
画像複製ワークフロー