Estoy buscando sugerencias con respecto a unicode aware std :: string library replacements. Tengo un montón de código que usa std :: string, sus iteradores, etc., y me gustaría ahora admitir cadenas de Unicode (se prefieren las implementaciones de código abierto o libre, las capacidades de regex serían geniales).Unicode std :: string class replacement
No estoy seguro en este momento si requiero una reescritura completa o si puedo salir con la colocación de una nueva biblioteca de cadenas que admita todas las interfaces std :: string. El mundo Unicode parece muy complejo y solo quiero habilitarlo en mis aplicaciones, no es necesario que aprenda cada aspecto de él.
btw ¿cómo funciona el operador de índice cuando tiene que volver una referencia a una estructura 1, 2,3 o 4 que en teoría podría cambiar a una estructura de 1,2,3 o 4 bytes. si se pasa un valor de mayor o menor tamaño, ¿el cambio de ida y vuelta de la representación interna de datos ocurre in situ?
Siempre hay std :: wstring, que proporciona una cadena de caracteres anchos; sin embargo, no se garantiza que funcione con unicode (el tamaño depende de la plataforma), pero puede ser útil. Pero sería un simple reemplazo directo para std :: string, como se define como: 'typedef std :: basic_string wstring' –
icabod
@icabod El uso de' std :: wstring' en sí mismo no resuelve el problema del póster, todavía dará resultados incorrectos, por ejemplo 'length()'. De hecho, 'std :: string' es suficiente si todos los datos se almacenan como UTF8. También vea: http://stackoverflow.com/questions/402283/stdwstring-vs-stdstring. – Darhuuk