Recherche de similarité audio
Ce tutoriel montre comment utiliser Milvus, la base de données vectorielle open-source, pour construire un système de recherche de similarité audio.
Le modèle ML et les logiciels tiers utilisés comprennent :
- PANNs (réseaux neuronaux audio pré-entraînés à grande échelle)
- MySQL
- Towhee
La recherche sur la parole, la musique, les effets sonores et d'autres types de recherche audio permet d'interroger rapidement des volumes massifs de données audio et de mettre en évidence des sons similaires. Les applications des systèmes de recherche de similarité audio comprennent l'identification d'effets sonores similaires, la minimisation des infractions à la propriété intellectuelle, etc. La recherche audio peut être utilisée pour rechercher et surveiller les médias en ligne en temps réel afin de réprimer les violations des droits de propriété intellectuelle. Elle joue également un rôle important dans la classification et l'analyse statistique des données audio.
Dans ce tutoriel, vous apprendrez à construire un système de recherche de similarités audio capable de renvoyer des clips sonores similaires. Les clips audio téléchargés sont convertis en vecteurs à l'aide des PANN. Ces vecteurs sont stockés dans Milvus qui génère automatiquement un identifiant unique pour chaque vecteur. Les utilisateurs peuvent ensuite effectuer une recherche de similarité vectorielle dans Milvus et interroger le chemin de données du clip audio correspondant à l'ID unique du vecteur renvoyé par Milvus.
Audio_search Audio_search_demo