Estoy diseñando una API que toma una URL como entrada y lee el contenido en esa URL. Cuando la URL es un protocolo "file:", ¿qué haría un mejor valor predeterminado para la codificación de caracteres?¿Cuál debería ser la codificación predeterminada para una API que lee desde una URL utilizando el archivo: protocolo?
- codificación nativa del sistema
- UTF-8
La API permite que esto se establece de forma explícita. Además, hay algunas heurísticas que podemos usar para determinar la codificación de caracteres, como la lista de materiales, si está disponible, pero cuando todos estos fallan, ¿cuál debería ser el valor predeterminado?
Por lo que puedo decir, los estándares no dicen nada sobre este tema. En igualdad de condiciones, quiero que lo correcto suceda con mayor frecuencia para alguien que ni siquiera sabe que existe codificación de caracteres.