2010-08-26 24 views
7

¿Hay algún programa que detecte la tasa de bits de un MP3? No estoy hablando de la tasa de bits efectiva con la que se ha codificado el archivo, sino de la tasa de bits real que se puede calcular solo mediante el análisis de espectro de frecuencia.Detección de velocidad de bits de MP3 a través del análisis de espectro de frecuencia

Por ejemplo, si tengo un MP3 codificado en 128 kbps cuyo tamaño es de 1 MB, y luego transcodigo este MP3 a 320 kbps cuyo tamaño se convierte en 3 MB, tendré la misma pista de audio idéntica, pero con diferentes tamaños .

Si tengo un MP3 de 320 kbps y lo transcodificamos a 128 kbps, perderé algo de calidad y, por lo tanto, algo de tamaño de archivo.

Pero aun así, no tengo forma de verificar que 320 kbps es la tasa de bits "real" de mi MP3.

detalles se explican en este documento: http://www.fileden.com/files/2009/2/14/55/My%20Documents/MP3%20Bit%20Rate%20Quality%20Detection%20through%20Frequency.pdf

+0

Se pierde calidad de cualquier manera, mp3 es con pérdidas cada vez que se codifica ... – MarcusJ

Respuesta

0

Lo único que se puede determinar fácilmente a partir del análisis del espectro de frecuencias es ¿cuál es la frecuencia de muestreo del archivo de entrada de mp3.

Por ejemplo, si su mp3 se muestrea en 44100, no tendrá ningún sonido por encima de 22050hz y eso será claramente visible en el gráfico de espectro.

Dado que se te cruce en el dominio trascendental aquí, intente esto:

  • codificar MP3 a 128 kbps
  • transcodificar con decir 320 kbps
  • intento RAR-ción o 7Z-ción archivo resultante y el archivo original . Observe las relaciones de compresión.

Su 'entropía' es decir. la aleatoriedad será diferente, y tal vez ese número le dirá algo acerca de cuánta información se "fabrica" ​​en la expansión de la tasa de bits durante la transcodificación.

+0

Si el proceso de transcodificación es 100% compatible con los estándares , entonces ninguna información en absoluto debería ser "fabricada". Una cosa que cambiará en la versión de 320 kbps es el modo estéreo. El valor predeterminado para 128 kbps es el estéreo conjunto, mientras que el valor predeterminado para 320 es el estéreo "verdadero". Entonces, si prueba esto, probablemente debería forzar el mismo modo estéreo para ambas velocidades de bits. (Por supuesto, la frecuencia de muestreo también debería ser la misma, pero eso debería ser obvio). Además, la versión de 320 kbps debe codificarse sin un filtro de corte, porque ya se ha aplicado. –

2

La frecuencia de corte y la velocidad de bits son independientes. Sí, la mayoría de las personas usa ajustes preestablecidos, por lo tanto, existe una correlación entre los dos, pero no es determinista.

0

Puede abrir el archivo "Adobe Audition" o "Cool Edit" y abrir la ventana de análisis de frecuencia. Si las líneas de frecuencia a 20 kHz o más, la tasa de bits de mp3 es de 320 kbps si las líneas de frecuencia son más pequeñas que 20 kHz, no son 320 kbps.

12

En primer lugar, https://www.google.com/?q=mp3+cutoff+frequency puede ser bastante esclarecedor.

En segundo lugar, casi todos los MP3 se codifican utilizando preajustes con filtros de paso bajo polifásicos bastante estándar. Como en realidad es imposible lograr una compresión sin pérdidas con MP3, lo que se pierde en realidad son los armónicos más altos de las frecuencias base (ver FFT, DCT, transformaciones de ondículas, etc.); el filtro se aplica de modo que los resultados del análisis de Fourier posterior del espectro sean más coherentes con el rango de audición humana (es decir, las frecuencias enmascarables/no curables se eliminan del análisis en absoluto). En realidad es imposible para lograr una alta compresión sin cortar/distorsionar gravemente las frecuencias más altas, ya que en realidad son ellos los que ocupan la mayor parte del espacio en el flujo de bits.

Por supuesto, sin el límite, la limitación del dominio de frecuencia sería menos precisa, pero ocurriría todavía.El corte se aplica, entre otras razones, de modo que los artefactos de compresión se generan fuera del rango de audición psicoacústica.

Como punto de referencia: haga un análisis de espectro del flujo (SA en tiempo real con clonación Winamp sería suficiente si los rangos de frecuencia más altos son lo suficientemente saturados, también puede hacer un espectrograma si tiene las herramientas) y encuentre el punto de corte. En el ejemplo siguiente, el corte ocurre a 15 kHz, lo que me informa que la transmisión se comprimió originalmente a 128 kbps; Incluso llegaría a decir que es posible distinguir < = 128 kpbs streams por ear con muchos tipos de música (drum'n'bass y otros géneros de la música electrónica con muchos máximos).

MP3 spectrum analysis

Los puntos de corte más comunes son: (tenga en cuenta que son "duros" en CBR y "suave" con el ABR/VBR)

  • 128 kbps: 15-16 kHz (muy audible en la música rock/electrónica "pérdida de espacio" efecto)
  • 192 kbps: ~ 19 kHz (apenas audible en la mayoría de los casos, considerado transparente por la mayoría)
  • 256-320 kbps:> ~ 20kHz (inaudible)

Sí, soy consciente de que algunos la gente puede oír por encima de 20 kHz, pero el efecto de enmascaramiento que aparece en la música más los tiempos de respuesta reales de los altavoces medios que en la música real el límite de 20 kHz es irrelevante para la calidad del sonido.

fuente: propia reasearch como ingeniero de sonido, más http://www.whatinterviewprep.com/prepare-for-the-interview/spectral-analysis/ como referencia adicional

Cuestiones relacionadas