Поиск сходства аудиофайлов
В этом руководстве показано, как использовать Milvus, векторную базу данных с открытым исходным кодом, для создания системы поиска сходства аудио.
Используемые модели ML и стороннее программное обеспечение включают:
- PANNs (Large-Scale Pretrained Audio Neural Networks)
- MySQL
- Towhee
Поиск по речи, музыке, звуковым эффектам и другим типам аудиозаписей позволяет быстро запрашивать огромные объемы аудиоданных и находить похожие звуки. Приложения систем поиска сходства звуков включают определение похожих звуковых эффектов, минимизацию нарушений прав интеллектуальной собственности и многое другое. Аудиопоиск может использоваться для поиска и мониторинга онлайн-медиа в режиме реального времени с целью пресечения нарушений прав интеллектуальной собственности. Он также играет важную роль в классификации и статистическом анализе аудиоданных.
В этом уроке вы узнаете, как построить систему поиска по сходству аудиоданных, которая может возвращать похожие звуковые клипы. Загруженные аудиоклипы преобразуются в векторы с помощью PANN. Эти векторы хранятся в Milvus, который автоматически генерирует уникальный идентификатор для каждого вектора. Затем пользователи могут провести поиск векторного сходства в Milvus и запросить путь к данным аудиоклипа, соответствующий уникальному идентификатору вектора, возвращенному Milvus.
Audio_search
Audio_search_demo