Tenemos un conjunto de aplicaciones que fueron desarrolladas para el juego de caracteres ASCII. Ahora, estamos tratando de instalarlo en Islandia, y estamos teniendo problemas donde los personajes islandeses se están jodiendo.¿Cómo se escribe el código que es seguro para UTF-8?
Estamos trabajando en nuestros problemas, pero me preguntaba: ¿existe una buena "guía" para escribir código C++ diseñado para caracteres de 8 bits y que funcionará correctamente cuando se le den datos UTF-8 a ¿eso?
No puedo esperar que todos lean todo el estándar Unicode, pero si hay algo más digerible disponible, me gustaría compartirlo con el equipo para que no nos topemos con estos problemas nuevamente.
Volver a escribir todas las aplicaciones para usar wchar_t o alguna otra representación de cadena no es posible en este momento. También notaré que estas aplicaciones se comunican a través de redes con servidores y dispositivos que usan caracteres de 8 bits, por lo que incluso si hiciéramos Unicode internamente, todavía tendríamos problemas con la traducción en los límites. En su mayor parte, estas aplicaciones solo pasan datos; no "procesan" el texto de ninguna otra forma que no sea copiarlo de un lugar a otro.
Los sistemas operativos utilizados son Windows y Linux. Usamos std :: string y strings simples de C. (Y no me pida para defender cualquiera de las decisiones de diseño Sólo estoy tratando de ayudar a solucionar el lío..)
Aquí es una lista de lo que se ha sugerido:
- The Absolute Minimum Every Software Developer Absolutely, Positively Must Know About Unicode and Character Sets (No Excuses!)
- UTF-8 and Unicode FAQ for Unix/Linux
- The Unicode HOWTO
¿Podría confirmarnos el sistema operativo de su aplicación? ¿Estás programando para Windows? ¿Está usando masivamente std :: string o el encabezado C de de nivel más bajo? –
paercebal
Si te gusta una respuesta, por favor la resumes, no hay razón para ser mezquino. –
¿Solo hace 30 minutos y ya está exigiendo un impulso de representante? :) –