2009-10-24 13 views

Respuesta

7

MFCC combinan consideración de los aspectos de la audición humana (percepción de frecuencia logarítmica, la mel scale) y la física de los instrumentos musicales (sobretonos estos sistemas a menudo tienen bien definidas que son los que harmonic - es por eso que los MFCC usan la FFT de la FFT), para dar una representación simplificada del timbre de un instrumento (donde se toman en cuenta la frecuencia y el volumen fundamental).

Podría escribir páginas sin fin sobre este tema, y ​​hay muchas disponibles en la web, por lo que una pregunta más específica que explique claramente lo que quiere saber sería útil. El algoritmo para calcular los MFCC se enumera en la parte superior de wikipedia page.

+0

tks para la respuesta. Entonces, si quiero obtener el timbre, ¿el MFCC es el camino correcto? –

+1

Sí, creo que sí, especialmente como primer ataque al problema. Es fácil de implementar, hay mucho escrito al respecto, y es un estándar contra el cual se comparan otros enfoques (y generalmente funciona bien en estas comparaciones), por lo que es una buena opción. – tom10

+0

En wiki el algoritmo es: 1. Tome la transformada de Fourier de (un extracto con ventana de) una señal. 2. Mapee los poderes del espectro obtenido anteriormente en la escala mel, usando ventanas superpuestas triangulares. 3. Tome los registros de las potencias en cada una de las frecuencias de mel. 4. Tome la transformada de coseno discreto de la lista de potencias de registro de mel, como si fuera una señal. 5. Los MFCC son las amplitudes del espectro resultante. Entiendo todo menos el paso 2: uso de ventanas superpuestas triangulares ¿Qué debo hacer? Pase la frecuencia a escala mel, pero ¿qué es esta ventana triangular que se superpone? –