Ricerca per similarità audio
Questo tutorial mostra come utilizzare Milvus, il database vettoriale open-source, per costruire un sistema di ricerca di similarità audio.
Il modello ML e il software di terze parti utilizzati includono:
- PANNs (Reti neurali audio preaddestrate su larga scala)
- MySQL
- Towhee
La ricerca di parlato, musica, effetti sonori e altri tipi di audio permette di interrogare rapidamente volumi enormi di dati audio e di far emergere suoni simili. Le applicazioni dei sistemi di ricerca per similarità audio includono l'identificazione di effetti sonori simili, la riduzione al minimo delle violazioni della proprietà intellettuale e altro ancora. L'audio retrieval può essere utilizzato per cercare e monitorare i media online in tempo reale per reprimere le violazioni dei diritti di proprietà intellettuale. Assume inoltre un ruolo importante nella classificazione e nell'analisi statistica dei dati audio.
In questa esercitazione imparerete a costruire un sistema di ricerca per similarità audio in grado di restituire clip audio simili. I clip audio caricati vengono convertiti in vettori utilizzando i PANN. Questi vettori vengono memorizzati in Milvus, che genera automaticamente un ID univoco per ogni vettore. Gli utenti possono quindi effettuare una ricerca di similarità vettoriale in Milvus e interrogare il percorso dei dati del clip audio corrispondente all'ID univoco del vettore restituito da Milvus.
Audio_search Audio_search_demo