音訊相似性搜尋
本教學示範如何使用開放原始碼向量資料庫 Milvus 來建立音頻相似性搜尋系統。
所使用的 ML 模型和第三方軟體包括
- PANNs (大型預訓音訊神經網路)
- MySQL
- Towhee
語音、音樂、音效等類型的音訊搜尋,讓快速查詢海量音訊資料並浮現相似聲音成為可能。音訊相似性搜尋系統的應用包括識別相似的音效、將 IP 侵犯減至最低等。音訊檢索可用於即時搜尋與監控線上媒體,以打擊侵犯智慧財產權的行為。它也在音訊資料的分類和統計分析中擔當著重要的角色。
在本教程中,您將學習如何建立一個能夠傳回相似聲音片段的音訊相似性搜尋系統。上傳的音訊片段會使用 PANNs 轉換成向量。這些向量會儲存在 Milvus 中,Milvus 會自動為每個向量產生唯一的 ID。然後,使用者可以在 Milvus 中進行向量相似性搜尋,並查詢與 Milvus 所傳回的唯一向量 ID 相對應的音訊素材資料路徑。
Audio_search
Audio_search_demo