Audio-Ähnlichkeitssuche
Dieses Tutorial zeigt, wie man Milvus, die Open-Source-Vektordatenbank, zum Aufbau eines Audio-Ähnlichkeitssuchsystems verwendet.
Das ML-Modell und die verwendete Software von Drittanbietern umfassen:
- PANNs (Large-Scale Pretrained Audio Neural Networks)
- MySQL
- Towhee
Die Suche nach Sprache, Musik, Soundeffekten und anderen Arten von Audiodaten ermöglicht die schnelle Abfrage großer Mengen von Audiodaten und das Auffinden ähnlicher Klänge. Zu den Anwendungen von Systemen zur Suche nach Audioähnlichkeit gehören die Identifizierung ähnlicher Klangeffekte, die Minimierung von Verletzungen des geistigen Eigentums und vieles mehr. Die Audiosuche kann dazu verwendet werden, Online-Medien in Echtzeit zu durchsuchen und zu überwachen, um gegen die Verletzung von Rechten des geistigen Eigentums vorzugehen. Sie spielt auch eine wichtige Rolle bei der Klassifizierung und statistischen Analyse von Audiodaten.
In diesem Tutorial lernen Sie, wie man ein System für die Suche nach Audioähnlichkeit aufbaut, das ähnliche Soundclips zurückliefert. Die hochgeladenen Audioclips werden mithilfe von PANNs in Vektoren umgewandelt. Diese Vektoren werden in Milvus gespeichert, das automatisch eine eindeutige ID für jeden Vektor erzeugt. Anschließend können die Benutzer eine Vektorähnlichkeitssuche in Milvus durchführen und den Audioclip-Datenpfad abfragen, der der von Milvus zurückgegebenen eindeutigen Vektor-ID entspricht.
Audio_Suche Audio_Suche_demo