Tengo una serie de sitios web que muestran caracteres no válidos. Las metaetiquetas de las páginas especifican la codificación UTF-8. Sin embargo, varias páginas contienen caracteres que no pueden ser interpretados por UTF-8, probablemente porque los archivos se guardaron con otra codificación (como ANSI). El que en particular me preocupa ahora es un apóstrofo elegante (como en "Bob's" ... lo siento si eso no aparece correctamente). El validador de W3 indica que la entidad es "\ x92", pero no validará el archivo porque no se correlaciona con unicode. Y, por supuesto, si abro el archivo en Notepad ++ y cambio la codificación a UTF-8, el personaje es reemplazado por un 92 en una caja negra.¿Cómo arreglo los caracteres HTML no válidos en páginas servidas con codificación diferente?
Aquí está mi pregunta: ¿cuál es la forma más fácil de solucionar esto? ¿Tengo que abrir todas las páginas y reemplazar ese personaje con un apóstrofo convencional? ¿O hay una solución rápida que podría agregar (por ejemplo, a IIS) que podría anular o corregir el problema de codificación? ¿O debo buscar/reemplazar fuerza bruta? Tengo cientos de páginas en estos sitios web y no tengo idea de cuántas de ellas tendría que cambiar, así que si alguien conoce una forma en que podría eludir este problema o solucionarlo rápidamente, lo agradecería.
Sí, este es un entorno de Windows. La mayoría de ellos son HTML estáticos en páginas ASP, desafortunadamente. Veré si eso es una posibilidad. – Andy