¿Alfabetizar texto árabe y japonés que está en Unicode?

¿Alguien tiene algún código para alfabetizar texto árabe y japonés que está en Unicode? Si el código estaba en ruby eso sería genial.¿Alfabetizar texto árabe y japonés que está en Unicode?

Fuente

2010-03-02 James Testa

No veo qué tiene que ver específicamente con el iPhone. –

Los caracteres en árabe y japonés son parte del alfabeto árabe y japonés. Creo que algunas personas podrían tomar su pregunta como un insulto. – johannes

@johannes: No creo que "alfabetizar" signifique "convertir a un alfabeto inglés", sino "ordenar en un orden apropiado". –

Los puntos de código Unicode no están listados en orden alfabético (Z < a, por ejemplo), pero intentan ser aproximadamente en ese orden de todos modos. Hay un orden unicode canónico, definido por Unicode Collation Algorithm y también son pedidos específicos del idioma (el orden francés no es exactamente igual al orden alemán o checo, incluso con el mismo alfabeto), que se puede especificar en la información de la configuración regional. Creo que el ICU library contiene los algoritmos específicos del idioma que estás buscando.

Fuente

2010-03-19 11:52:19

No sé Ruby, pero Python tiene una función, ord() que traduce un carácter especial Unicode a su punto de código Unicode. Por ejemplo,

>>> a = u'ل' 
>>> ord(a) 
0: 1604 
>>> b = u'ع' 
>>> ord(b) 
1: 1593

Busque algo así en Ruby. Supongo que los símbolos árabes se enumeran en unicode en orden alfabético.

Fuente

2010-03-02 02:13:16

¿Ayudaría esto con esta pregunta? Si hiciéramos esto en caracteres latinos comunes, las letras se clasificarían en mayúsculas o minúsculas, lo que no tendría sentido en algunas situaciones. –

Correcto, si eso también se aplica al árabe y al japonés, supongo que el OP tendría que dar cuenta de eso. –

Para hacer la pregunta obvia, ¿qué no te gusta de mylist.sort?

Fuente

2010-03-02 13:47:48

¿mylist.sort funciona con Unicode y conoce el orden alfabético del alfabeto árabe o japonés? –

... ¿por qué no lo intentas y ves? –

Dependiendo de sus necesidades words.sort en rubí estará bien para los japoneses. El orden en que aparecen los caracteres en Unicode se encuentra en un orden de clasificación razonablemente bueno. Sin embargo, no puedo responder por el árabe, pero creo que está bien también.

Fuente

2010-03-03 16:33:49 Kimtaro

mylist.sort debería funcionar de la caja en Ruby 1.9 (que tiene incorporado el soporte de Unicode). En Ruby 1.8, donde la compatibilidad con Unicode no está incorporada, creo que tendrías que usar la gema character-encodings para extender la clase String con las comparaciones de cadenas UTF-8. (Y luego mylist.sort funcionaría.)

Fuente

2010-03-18 14:47:57

¿Alfabetizar texto árabe y japonés que está en Unicode?

Respuesta

Cuestiones relacionadas