2009-02-12 47 views
6

Tengo a problem con codificación de caracteres en algunas páginas HTML. Parece que la causa del problema es que algunos de los archivos .html no se guardan como archivos codificados en UTF-8. Aunque he ordenado a Eclipse que guarde estos archivos como UTF-8, cuando los abro en un navegador, indica que los archivos son ISO-8859-1.cambiar la codificación del archivo

¿Cómo puedo cambiar la codificación de estos archivos a UTF-8?

ACTUALIZACIÓN: que ya tienen las siguientes incluidos en la sección de cada página web

<meta http-equiv="Content-Type" content="text/html; charset=UTF-8" /> 

Estoy utilizando el servidor web Apache.

Gracias, Donal

+0

¿Qué servidor web estás usando? – Akrikos

Respuesta

7

Es posible que tenga que cambiar el encabezado de tipo de contenido que su servidor web envía al cliente.

Editar: Si bien esto funcionó para esta situación en particular, usar una herramienta para cambiar la codificación del archivo sugerido por otros carteles puede ser una solución mejor en otras situaciones. YMMV.


instrucciones para guardar como UTF-8 en Eclipse (que se da cuenta de que ya tienen):

probablemente debería cambiar la codificación predeterminada en el espacio de trabajo para el documento HTML.

Esto es para Eclipse 3.4. Si tiene una versión diferente, esto puede ser un poco diferente.

Goto Window-> Preferencias
En la ventana Preferencias Goto General-> Tipos de contenido
En este punto, se puede especificar un 'Codificación predeterminada' para los archivos de cerca de la parte inferior de la ventana de preferencias. Expande 'Texto' y selecciona HTML. En la entrada 'Codificación predeterminada', ponga UTF-8. Luego haga clic en 'actualizar' a la derecha.

Después de esto, todos los archivos HTML deben guardarse en formato UTF-8.

4

El problema con UTF-8 es que no hay una secuencia de bytes magia al inicio de estos archivos - única oportunidad del navegador para detectar UTF-8 es bien de la declaración XML, HTML meta tags o alguna heurística como alternativa.

Asegúrese de que exista una declaración de codificación XML o algunas metaetiquetas HTML en el encabezado del HTML.

<?xml version="1.0" encoding="utf-8"?> 

justo debajo DOCTYPE si es XHTML o

<meta http-equiv="Content-Type" content="text/html; charset=utf-8"> 

en la sección de cabecera.

3

Puede usar iconv para convertir archivos de una codificación de caracteres a otra.

1

Trate de añadir

<meta http-equiv="Content-Type" content="text/html; charset=UTF-8"> 

a la sección de cabecera de los archivos html, o asegurarse de que el servidor está sirviendo a los archivos con un encabezado HTTP Content-Type. Sin ninguno de estos, el navegador solo puede adivinar la codificación de caracteres.

0

Hasta donde yo sé, configurar la codificación de caracteres en Eclipse en realidad no convierte los archivos, simplemente le dice a Eclipse cómo quiere que se interpreten. Su mejor opción es usar una herramienta de conversión como la sugerida por Adam.

1

En Eclipse 3.7, vaya a:

Windows> Preferencias> General> Espacio de trabajo

En "Archivo de texto de codificación" establecer la codificación de archivo que necesita.

Cuestiones relacionadas