Estoy analizando muchos sitios. Todo funciona bien, estoy leyendo declaraciones de charset para convertir codificaciones. Ahora tengo un problema con http://celleheute.de/sonntagsfuhrung-3/.¿Prefiere la declaración del conjunto de caracteres en metaetiqueta HTML o encabezado HTTP?
La metaetiqueta HTML dice que el contenido está codificado como ISO-8859-2, pero el encabezado HTTP dice que es UTF-8. Y realmente, el contenido está codificado en UTF, así que cuando mi analizador intente convertir el contenido a ISO, romperá algunos caracteres.
Ahora mi pregunta es, ¿qué declaración debería preferir? ¿Debo ignorar las metaetiquetas, cuando puedo encontrar la declaración en el encabezado HTTP o viceversa? ¿Qué harán la mayoría de los navegadores web?