¿Tiene sentido almacenar texto codificado en UTF-16 usando wchar_t*
en Linux? El problema obvio es que wchar_t
tiene cuatro bytes en Linux y UTF-16 toma generalmente dos (o a veces dos grupos de dos) bytes por carácter.wchar_t para UTF-16 en Linux?
Estoy tratando de usar una biblioteca de terceros que hace exactamente eso y parece muy confuso. Parece que las cosas están en mal estado porque en Windows wchar_t
son dos bytes, pero solo quiero volver a comprobarlo ya que es una biblioteca comercial bastante cara y puede ser que simplemente no entiendo algo.
** Puede ** almacenar un valor de 2 bytes de longitud en una variable de 4 bytes de largo ... –
Creo que debe leer y comprender [esto] (http://www.joelonsoftware.com/articles /Unicode.html) –
¿Hay alguna razón para no usar 'uint16_t' para representar una unidad de código UTF-16? –