Necesito tomar una señal de audio y extraer fotogramas de audio superpuestos. Entonces necesito convertir estos a datos de frecuencia (material de FFT/como un espectrograma) y analizar la información de frecuencia.¿Buenas bibliotecas de sonido?
Por ejemplo, si tengo un archivo mp3 de 1 minuto, quiero dividir el archivo en archivos más pequeños, de 00: 00,000 a 00: 03,000, de 00: 00.010 a 00: 03.010. Entonces necesito ver el desglose de frecuencia de cada subarchivo.
¿Qué lenguajes de programación tienen buenas herramientas de audio que podrían ayudarme a hacer esto? ¿Hay herramientas de línea de comandos de Linux que pueda usar? Puntos de bonificación para Node.js (sí, a la derecha) o Haskell, con los que estoy más familiarizado.
En Python he tenido éxito con [Audiolab] (http://www.ar.media.kyoto-u.ac.jp/members/david/softwares/audiolab/sphinx/index.html) con Numpy. – Vortico
También usaría Python/Numpy. Si desea tratar con archivos mp3, necesita una biblioteca para decodificarlos, como ffmpeg. Puede llamar a ffmpeg desde python usando llamadas de subproceso. – TJD
Ha habido alguna discusión sobre las bibliotecas de audio para node.js, pero no sé de nada maduro. Consulte [esta discusión en la lista de distribución] (http://groups.google.com/group/nodejs/browse_thread/thread/5b62789562697956) para obtener los puntos de entrada. Estoy pensando en Python. –