Bild-Deduplizierung
Dieses Tutorial zeigt, wie man Milvus, die Open-Source-Vektordatenbank, verwendet, um ein System zur Bilddeduplizierung aufzubauen.
Das ML-Modell und die verwendete Software von Drittanbietern umfassen:
ResNet-50
In den letzten Jahren ist eine exponentielle Zunahme von nutzergenerierten Inhalten zu beobachten. Menschen können ein Foto, das sie aufgenommen haben, sofort auf eine Social-Media-Plattform hochladen. Bei einer solchen Fülle von Bilddaten gibt es jedoch auch viele doppelte Inhalte. Um die Benutzerfreundlichkeit zu verbessern, müssen diese doppelten Bilder entfernt werden. Ein Bild-Deduplizierungssystem erspart uns die manuelle Arbeit, Bilder in der Datenbank einzeln zu vergleichen, um doppelte Bilder herauszufiltern. Das Heraussuchen exakt identischer Bilder ist keine komplizierte Aufgabe. Es kann jedoch vorkommen, dass ein Bild vergrößert, beschnitten oder in der Helligkeit oder Graustufe verändert wurde. Das Bild-Deduplizierungssystem muss diese ähnlichen Bilder identifizieren und ebenfalls eliminieren.
In diesem Lernprogramm lernen Sie, wie man ein Bild-Deduplizierungssystem aufbaut. In diesem Tutorial wird das ResNet-50-Modell verwendet, um Merkmale von Bildern zu extrahieren und sie in Vektoren umzuwandeln. Anschließend werden diese Bildvektoren in der Milvus-Vektordatenbank gespeichert und eine Vektorähnlichkeitssuche wird ebenfalls in Milvus durchgeführt.
Bildduplizierung_Workflow