2009-02-06 16 views

Respuesta

27

Si la codificación está configurada correctamente (y el documento se guarda como UTF-8), debería poder trabajar solo con los caracteres. Del W3C:

El uso de una codificación como UTF-8 significa que puede evitar la necesidad de la mayoría de los escapes y simplemente trabajar con caracteres.

http://www.w3.org/International/questions/qa-escapes

Sin embargo, usted todavía tiene que usar entidades de caracteres especiales, a mayor/menor que.

4

Según mi experiencia, siempre y cuando tus datos sean realmente UTF-8 y le digas correctamente al navegador que es UTF-8, entonces no necesitas usar entidades. Excepto por cosas como & gt ;, & lt ;, & quot; por supuesto.

7

Las entidades son útiles en los archivos de código fuente del programa (en programas que generan HTML). Muchos estándares de codificación dicen que los archivos deben estar en ASCII simple. Excepto, por supuesto, los archivos que en realidad contienen el contenido textual, por ejemplo, los archivos .po con traducciones.

Cuando tiene un archivo largo con pocos caracteres no ASCII dentro, entonces es extremadamente fácil guardar el archivo en una codificación incorrecta sin darse cuenta de que sus personajes se han atornillado.

Otra buena razón para usar caracteres que no sean ASCII es similar a los caracteres. ¿Puedes ver la diferencia entre las siguientes dos líneas de código:

print "<title>" + pagename + " – " + sitename + "</title>"; 
print "<title>" + pagename + " - " + sitename + "</title>"; 

Pero mediante el uso de entidades la diferencia es obvia:

print "<title>" + pagename + " &ndash; " + sitename + "</title>"; 
print "<title>" + pagename + " - " + sitename + "</title>"; 

Pero fuera de los archivos de código fuente de los programas, UTF-8 es claramente el camino a seguir.

Cuestiones relacionadas