音频相似性搜索
本教程演示了如何使用开源向量数据库 Milvus 构建音频相似性搜索系统。
使用的 ML 模型和第三方软件包括
- PANNs(大规模预训练音频神经网络)
- MySQL
- Towhee
语音、音乐、音效和其他类型的音频搜索使快速查询海量音频数据并显示相似声音成为可能。音频相似性搜索系统的应用包括识别相似的声音效果、最大限度地减少知识产权侵权等。音频检索可用于搜索和实时监控在线媒体,以打击侵犯知识产权的行为。它还在音频数据的分类和统计分析中发挥着重要作用。
在本教程中,您将学习如何构建一个能返回相似声音片段的音频相似性搜索系统。上传的音频片段使用 PANNs 转换成向量。这些向量存储在 Milvus 中,Milvus 会自动为每个向量生成唯一的 ID。然后,用户可以在 Milvus 中进行向量相似性搜索,并查询与 Milvus 返回的唯一向量 ID 相对应的音频片段数据路径。
音频搜索 音频 搜索演示