2009-10-28 9 views
5

Quiero hacer el algoritmo Mel-Frequency Cepstrum pero hay algunas cosas que no entiendo.¿Cómo hacer un algoritmo MFCC?

Después de que termine el FTT, necesitamos "Mapear los poderes del espectro obtenido anteriormente en la escala mel, utilizando ventanas superpuestas triangulares".

Sé cómo calcular los triángulos y también sé cómo pasar a mel scale. Simplemente no sé qué hacer con ellos.

Si se definen los triángulos, ¿cómo mapeo la potencia del espectro obtenido anteriormente en la escala mel?

¿Es así: Sume las frecuencias dentro del triángulo y luego páselo a mel scale? o ¿Suma las frecuencias dentro del triángulo de acuerdo con un valor de peso (definido por la altura del triángulo en ese punto) y luego lo pasa a escala mel? o ¿Pasa todas las frecuencias dentro del triángulo a mel scale de acuerdo con el valor weith? ¿Otra cosa?

¿Puede cualquier persona

aclara esto a mí

+1

Mi sugerencia es ser un miembro sincero y amable de la comunidad. Deje de publicar con diferentes nombres de usuario (Andre, Andre Ferreira y aF); agradecer a las personas por su ayuda en sus tres preguntas similares anteriores, y apoyar y aceptar sus respuestas si corresponde (esta pregunta actual sigue claramente a mis respuestas anteriores pero no hay acuse de recibo ni votos arriba); y sea sincero (no responda sus propias preguntas como si fuera otra persona). Para preguntas como estas, es una comunidad muy pequeña. De lo contrario, paga a alguien para que te ayude ... ¿te gustaría saber mis tarifas? – tom10

+0

No estaba registrado y no pude acceder después de cerrar la sesión. Realmente no entiendo muy bien esta parte y estoy agradecido por lo que ha dicho hasta ahora. Entonces, ¿me pueden ayudar a entenderlo? Ya leí muchas cosas, pero esta parte realmente no la entiendo. –

+0

Sure. 1) El etiquetado de preguntas es muy importante. Creo que para que más personas vean tu pregunta etiqueta también con "FFT" y "procesamiento de señal".2) las personas en SO están motivadas por ayudar a las personas y obtener puntos, así que recomiéndelo haciendo clic en la flecha de la pregunta o respuesta, y acepte la respuesta a su pregunta que le funcione (haga clic en el cheque, yo pensar). 3) siga sus propias preguntas incluso después de haber recibido una respuesta para que las personas se sientan reconocidas. – tom10

Respuesta

5

Creo que este paso del proceso es un poco raro y no tiene sentido completo (para mí de todos modos). El centro de las bandas de filtro está igualmente espaciado a lo largo de la escala mel, pero son triángulos en la escala lineal, es decir, al igual que la figura here.

Luego calcule la suma ponderada usando estos triángulos a lo largo del eje x lineal. (En este paso previo, creo que algunos enfoques se normalizan por el área del triángulo del filtro, y otros no, y honestamente no estoy seguro de las consecuencias finales aquí, aunque sospecho que puede no significar mucho excepto modificar el interpretación final que son todas comparaciones relativas de todos modos. Uno mantiene la energía total, y el otro da contribuciones igualmente ponderadas por banda.) A continuación, tome el registro de esto (que convierte el factor de volumen global en un desplazamiento).

Editar: Para ser más claros al aplicar los filtros ... Cada triángulo representa un filtro separado, produciendo una suma ponderada por separado. Si hay veinte filtros en su banco de filtros, habrá veinte triángulos y veinte sumas ponderadas para calcular. Para aplicar cada filtro, para cada valor del eje x, multiplique el valor del filtro en esa ubicación x por el valor de la función en esa ubicación x, y añádalo a la suma de ese filtro en particular. La mayoría de los valores del eje x con dos filtros están presentes allí, por lo que en cada ubicación x hace una contribución a dos filtros.

+0

He editado mi respuesta para responder a su pregunta, espero. Si no es así, repita su pregunta con mucho cuidado para que entienda lo que no está claro. – tom10

+0

Además, probablemente aún pueda aceptar mi respuesta, incluso sin 15 puntos. No es que me muera por obtener los puntos aquí, sinceramente es más para comprometerte, pero mira esto ... http://meta.stackexchange.com/questions/8396/how-do-i-accept-an -answer-where-do-i-click Pero no lo aceptemos por un día de todos modos, para que más personas vean la pregunta y quizás alguien tenga algo iluminador para decir. – tom10

+0

¡Gracias de nuevo! Offcourse Acepto su respuesta. Has sido excelente conmigo. La duda final está relacionada con la conversión de la frecuencia a escala mel. Esto se hace aplicando los filtros y la suma de los pesos? o Tengo que hacer algo como esto: http://en.wikipedia.org/wiki/Mel_scale en cualquier lado? –

Cuestiones relacionadas