Tengo algunos problemas con la codificación de caracteres. cuando pongo los dos caracteres siguientes en un archivo de texto UTF32 codificado:
鸕
y luego ejecutar este código en ellos: System.IO.Str
utf16 o utf32? Intento almacenar contenido en muchos idiomas. Algunos de los idiomas utilizan fuentes de doble ancho (por ejemplo, las fuentes japonesas con frecuencia tienen el doble de ancho que las
Duplicar posible: Why UTF-32 exists whereas only 21 bits are necessary to encode every character? El punto de código Unicode máxima es 0x10ffff en UTF-32. UTF-32 tiene 21 bits de información y 11 bits
Nunca he entendido el sentido de la codificación UTF-16. Si necesita poder tratar cadenas como acceso aleatorio (es decir, un punto de código es lo mismo que una unidad de código), entonces necesita U
¿Qué bibliotecas C o C++ de código abierto pueden convertir arbitrariamente UTF-32 en NFC? Bibliotecas que creo que pueden hacer esto hasta ahora: ICU, Qt, GLib (¿no estoy seguro?). No necesito ningún