¿Cómo puedo detectar (preferiblemente con Python) archivos duplicados de MP3 que pueden codificarse con diferentes velocidades de bits (pero son la misma canción) y etiquetas ID3 que pueden ser incorrectas?¿Detecta archivos MP3 duplicados con diferentes tasas de bits y/o diferentes etiquetas ID3?
Sé que puedo hacer una suma de comprobación MD5 del contenido de los archivos, pero eso no funcionará para diferentes velocidades de bits. Y no sé si las etiquetas ID3 tienen influencia en la generación de la suma de comprobación MD5. ¿Debería volver a codificar los archivos MP3 que tienen una tasa de bits diferente y luego puedo hacer la suma de comprobación? ¿Que recomiendas?
Fácil de usar la biblioteca de Python para hacer exactamente esto: https://github.com/worldveil/dejavu – lollercoaster