Búsqueda por similitud de audio
Este tutorial muestra cómo utilizar Milvus, la base de datos vectorial de código abierto, para crear un sistema de búsqueda de similitudes de audio.
El modelo ML y el software de terceros utilizados incluyen:
- PANNs (Redes neuronales de audio preentrenadas a gran escala)
- MySQL
- Towhee
La búsqueda de voz, música, efectos de sonido y otros tipos de audio permite consultar rápidamente volúmenes masivos de datos de audio y sacar a la superficie sonidos similares. Las aplicaciones de los sistemas de búsqueda de similitudes de audio incluyen la identificación de efectos de sonido similares, la minimización de las infracciones de propiedad intelectual, etc. La recuperación de audio puede utilizarse para buscar y supervisar medios en línea en tiempo real con el fin de reprimir las infracciones de los derechos de propiedad intelectual. También desempeña un papel importante en la clasificación y el análisis estadístico de datos de audio.
En este tutorial, aprenderás a construir un sistema de búsqueda de similitudes de audio que pueda devolver clips de sonido similares. Los clips de audio cargados se convierten en vectores utilizando PANNs. Estos vectores se almacenan en Milvus, que genera automáticamente un ID único para cada vector. A continuación, los usuarios pueden realizar una búsqueda de similitud vectorial en Milvus y consultar la ruta de datos del clip de audio correspondiente al ID de vector único devuelto por Milvus.
Audio_search Audio_search_demo