2012-02-07 5 views
5

Estoy diseñando una API que toma una URL como entrada y lee el contenido en esa URL. Cuando la URL es un protocolo "file:", ¿qué haría un mejor valor predeterminado para la codificación de caracteres?¿Cuál debería ser la codificación predeterminada para una API que lee desde una URL utilizando el archivo: protocolo?

  • codificación nativa del sistema
  • UTF-8

La API permite que esto se establece de forma explícita. Además, hay algunas heurísticas que podemos usar para determinar la codificación de caracteres, como la lista de materiales, si está disponible, pero cuando todos estos fallan, ¿cuál debería ser el valor predeterminado?

Por lo que puedo decir, los estándares no dicen nada sobre este tema. En igualdad de condiciones, quiero que lo correcto suceda con mayor frecuencia para alguien que ni siquiera sabe que existe codificación de caracteres.

Respuesta

2

Siempre use UTF-8 si es posible, y documente esto en su documentación API. UTF-8 es un estándar sólido para la codificación y muy a prueba de futuro. Evitaría generar trabajo potencial para usted al admitir otras codificaciones. También UTF-8 será fácil de usar si migra la API para ser utilizada de tal manera que se puede acceder a través de un servicio web.

Cuestiones relacionadas