Supongamos que tenemos una cadena arbitraria, s.Unicode - generalmente trabajando con él en C++
s tiene la propiedad de ser de casi cualquier parte del mundo. Las personas de EE. UU., Japón, Corea, Rusia, China y Grecia escriben de vez en cuando en s. Afortunadamente, no tenemos viajeros en el tiempo que usen Linear A, sin embargo.
Por el bien de discusión, vamos a suponer que queremos hacer operaciones de cadena tales como:
- inversa
- longitud
- capitalizar
- minúsculas índice
- en
y, solo por el motivo de la discusión, supongamos que queremos escribir estas rutinas nosotros mismos (en lugar de ocupar una biblioteca), y no tenemos ningún software heredado para mantener.
Hay 3 estándares para Unicode: utf-8, utf-16 y utf-32, cada uno con pros y contras. Pero digamos que soy muy tonto, y quiero un Unicode que los gobierne a todos (porque suena difícil rodar una biblioteca de adaptación dinámica para 3 tipos diferentes de codificaciones de cadena que oculta la diferencia del usuario de API).
- ¿Qué codificación es la más general?
- ¿Qué codificación es compatible con wchar_t?
- ¿Qué codificación es compatible con el STL?
- ¿Están estas codificaciones todas (o nada) anuladas?
-
El objetivo de esta pregunta es para educar a mí mismo y otros en información útil y utilizable para Unicode: leer los RFC está muy bien, pero hay una 'pila' de la información relacionada con compiladores, lenguajes , y sistemas operativos que los RFC no cubren, pero es vital saber que realmente usan Unicode en una aplicación real.
No es exactamente una tontería sino que también lee http://stackoverflow.com/questions/114611/what-is-the-best-unicode-library-for-c –
@Martin: No estoy realmente interesado - en esto tiempo: cuál es la mejor biblioteca. Estoy más interesado en ponerme al día con la información sobre Unicode en general y sobre cómo escribiré un reverso (o posiblemente una rutina más oscura) en Unicode y no haré que explote en, digamos, Turquía. :-) –
sí, es por eso que no cerré como una víctima, pero alguien que encuentre esta pregunta PODRÍA estar interesado en solo usar una biblioteca. Si este hilo obtiene buenas respuestas, haré una referencia cruzada en el otro hilo. –