Sé que es habitual, pero ¿por qué? ¿Existen razones técnicas reales por las que cualquier otra forma sería una mala idea o se basa solo en la historia de la codificación y la compatibilidad con versiones anteriores? Además, ¿cuáles son los peligros de no usar UTF-8
, pero alguna otra codificación (más notablemente, UTF-16
)?¿Por qué la codificación UTF-8 se utiliza al interactuar con un entorno UNIX/Linux?
Editar: Al interactuar, me refiero principalmente a shell
y libc
.
Windows agregó soporte para UTF-16 al hacer una versión duplicada de toda la API de Windows. Agregar soporte para UTF-8 hubiera sido mucho más simple. – dan04
En realidad, Windows agregó soporte para 'UCS-2' al hacer eso, y luego fue" 640k de nuevo "cuando resultó que 16 bits no eran suficientes ... ;-) –
@ dan04 Hubiera sido difícil escriba NT usando UTF-8 en lugar de UCS2 dado que NT es anterior a UTF-8. Eso habría requerido una previsión extraordinaria. –