Text zu Bild Suchmaschine
Dieses Tutorial zeigt, wie man Milvus, die Open-Source-Vektordatenbank, zum Aufbau einer Text-Bild-Suchmaschine verwendet.
Sie können schnell eine minimale brauchbare Text-zu-Bild-Suchmaschine erstellen, indem Sie das Basis-Tutorial befolgen. Alternativ können Sie auch das Vertiefungstutorial lesen, in dem alles von der Modellauswahl bis zur Dienstbereitstellung behandelt wird. Sie können eine fortschrittlichere Text-zu-Bild-Suchmaschine für Ihre eigenen geschäftlichen Anforderungen erstellen, indem Sie die Anweisungen im Vertiefungstutorial befolgen.
Das ML-Modell und die verwendete Software von Drittanbietern umfassen:
Heutzutage verlieren traditionelle Textsuchmaschinen ihren Charme und immer mehr Menschen wenden sich TikTok als ihrer Lieblingssuchmaschine zu. Bei einer herkömmlichen Textsuche gibt man Schlüsselwörter ein und bekommt alle Texte angezeigt, die dieses Schlüsselwort enthalten. Die Leute beschweren sich jedoch, dass sie bei einer solchen Suche nicht immer das finden, was sie wollen. Darüber hinaus sind die Ergebnisse nicht intuitiv genug. Die Menschen sagen, dass sie Bilder und Videos viel intuitiver und angenehmer finden, als sich durch Textzeilen wühlen zu müssen. Daraus entstand die cross-modale Text-Bild-Suchmaschine. Mit einer solchen neuen Art von Suchmaschine können Menschen relevante Bilder finden, indem sie einen Textabschnitt mit einigen Schlüsselwörtern eingeben.
In diesem Lernprogramm lernen Sie, wie man eine Text-Bild-Suchmaschine erstellt. In diesem Tutorial wird das CLIP-Modell verwendet, um Merkmale von Bildern zu extrahieren und sie in Vektoren umzuwandeln. Diese Bildvektoren werden dann in der Milvus-Vektordatenbank gespeichert. Wenn Benutzer Abfragetexte eingeben, werden diese Texte ebenfalls mit demselben ML-Modell CLIP in Einbettungsvektoren umgewandelt. Anschließend wird in Milvus eine Vektorähnlichkeitssuche durchgeführt, um die ähnlichsten Bildvektoren zum eingegebenen Textvektor zu finden.
Text_Bild_Suche