2010-08-19 6 views

Respuesta

4

Quiero saber el algoritmo estándar para la conversión de caracteres Unicode en minúsculas según lo propuesto por unicode.org.

El algoritmo básico es simplemente para concatenar la minúscula de cada carácter individual (como se define por la penúltima columna en UnicodeData.txt). También hay algunos special rules para manejar asignaciones de caracteres múltiples (© → i̇ con un PUNTO DE COMBINACIÓN adicional ARRIBA sobre i), asignaciones condicionales (Σ → ς al final de una palabra, pero σ de otra manera), y reglas sensibles al lenguaje (como Turco sin puntos ı).

Además, ¿la mayoría de los lenguajes de programación siguen esta norma propuesta?

Java does. Python implementa las reglas básicas, pero no las reglas especiales. Y C no tiene soporte Unicode estandarizado en absoluto.

+0

¿Qué tal javascript? ¿Sigue el estándar? – Albert

+1

JavaScript implementa las reglas básicas de la carcasa, pero no las especiales. – dan04

+1

Esa es una gran información. ¡Gracias! – Albert

1

Los idiomas de programación varían en qué tan bien soportan unicode. La mayoría no tiene caracteres Unicode como un tipo incorporado. Por lo general, se maneja en una biblioteca o mediante llamadas al sistema operativo.

Por ejemplo, C++ no tiene un tipo de carácter Unicode nativo, pero tiene soporte de localización en stl (que se define como parte del lenguaje). Ada tiene un tipo nativo Wide_Character, así como soporte de biblioteca para manipularlo.

+0

"la mayoría no tiene caracteres Unicode como tipo incorporado": eso ya no es cierto para los idiomas más modernos. –

+2

Tal vez, pero muchos de esos idiomas "antiguos" (por ejemplo, la familia C) todavía se usan mucho. Muchos de esos "idiomas más modernos" obtienen más información que uso. Aún así, están disponibles si el soporte nativo Unicode es importante para usted. –

+0

¡Gracias por la información! – Albert

2

.NET tiene soporte Unicode y ofrece funciones integradas para cambiar entre mayúsculas y minúsculas. Esto también es cierto con algunos otros idiomas también.

+1

.NET no es un idioma. – mickeyf

+0

.NET es una plataforma, no un idioma. Win32 tiene soporte unicode también. –

+3

Pero se aplica a todos los idiomas que usan .NET Framework, incluidos C#, VB.NET, F #, etc. – Russ

Cuestiones relacionadas