milvus-logo
Star
0
Forks
0
快速开始

音频相似度检索

本教程将介绍如何使用开源向量数据库 Milvus 搭建音频相似度检索系统。

本教程中使用到的 ML 模型及第三方软件包括:

  • PANNs (大规模预训练音频神经网络)
  • MySQL

音频检索(如演讲、音乐、音效等检索)实现了在海量音频数据中查询并找出相似声音片段。音频相似性检索系统可用于识别相似的音效、最大限度减少知识产权侵权等。音频检索还可以用于实时网络媒体的搜索和监控,来打击侵犯知识产权的行为。在音频数据的分类和统计分析中,音频检索也发挥着重要作用。


在本教程中,你将学会如何构建一个音频检索系统,用来检索相似的声音片段。使用 PANNs 将上传的音频片段转换为向量数据,并存储在 Milvus 中。Milvus 自动为每个向量生成唯一的 ID。然后用户就可以在 Milvus 中进行向量相似度搜索,Milvus 返回的检索结果为向量 ID,每个 ID 对应音频片段数据的路径。


Audio_search
Workflow of an audio similarity search system.
Audio_search_demo
Demo of an audio similarity search system.

该页面是否对你有帮助?
本页目录