¿Alguien tiene algún código para alfabetizar texto árabe y japonés que está en Unicode? Si el código estaba en ruby eso sería genial.¿Alfabetizar texto árabe y japonés que está en Unicode?
Respuesta
Los puntos de código Unicode no están listados en orden alfabético (Z < a, por ejemplo), pero intentan ser aproximadamente en ese orden de todos modos. Hay un orden unicode canónico, definido por Unicode Collation Algorithm y también son pedidos específicos del idioma (el orden francés no es exactamente igual al orden alemán o checo, incluso con el mismo alfabeto), que se puede especificar en la información de la configuración regional. Creo que el ICU library contiene los algoritmos específicos del idioma que estás buscando.
No sé Ruby, pero Python tiene una función, ord() que traduce un carácter especial Unicode a su punto de código Unicode. Por ejemplo,
>>> a = u'ل'
>>> ord(a)
0: 1604
>>> b = u'ع'
>>> ord(b)
1: 1593
Busque algo así en Ruby. Supongo que los símbolos árabes se enumeran en unicode en orden alfabético.
¿Ayudaría esto con esta pregunta? Si hiciéramos esto en caracteres latinos comunes, las letras se clasificarían en mayúsculas o minúsculas, lo que no tendría sentido en algunas situaciones. –
Correcto, si eso también se aplica al árabe y al japonés, supongo que el OP tendría que dar cuenta de eso. –
Para hacer la pregunta obvia, ¿qué no te gusta de mylist.sort
?
¿mylist.sort funciona con Unicode y conoce el orden alfabético del alfabeto árabe o japonés? –
... ¿por qué no lo intentas y ves? –
Dependiendo de sus necesidades words.sort
en rubí estará bien para los japoneses. El orden en que aparecen los caracteres en Unicode se encuentra en un orden de clasificación razonablemente bueno. Sin embargo, no puedo responder por el árabe, pero creo que está bien también.
mylist.sort
debería funcionar de la caja en Ruby 1.9 (que tiene incorporado el soporte de Unicode). En Ruby 1.8, donde la compatibilidad con Unicode no está incorporada, creo que tendrías que usar la gema character-encodings
para extender la clase String con las comparaciones de cadenas UTF-8. (Y luego mylist.sort
funcionaría.)
- 1. Fuentes Unicode para japonés
- 2. Texto árabe en as3
- 3. ¿La búsqueda de texto completo de MySql funciona razonablemente con idiomas no latinos (hebreo, árabe, japonés ...)
- 4. Cuadro de texto árabe
- 5. Codificación HTML de texto en japonés
- 6. Captcha para japonés y chino?
- 7. En Xcode, ¿cómo mostrar texto combinando inglés + árabe y comenzando con árabe?
- 8. Javascript + eliminar diacrítica texto árabe dinámicamente
- 9. Demasiados UILabels con texto Unicode
- 10. Consola de Windows y Qt Texto Unicode
- 11. Texto RTF Unicode en RichEdit
- 12. Expresiones regulares (regex) en japonés
- 13. texto con secuencias de escape Unicode a Unicode en Python
- 14. Problema de alineación de texto al utilizar la fuente árabe
- 15. Función PHP imagettftext() y unicode
- 16. mysql_fetch_array devuelve texto no Unicode
- 17. C# Botón Texto Caracteres Unicode
- 18. ¿Cómo mostrar el texto Unicode en OpenGL?
- 19. Alfabetizar rápidamente un archivo grande a través de python
- 20. iterar a través de cadenas Unicode y comparar con Unicode en el diccionario de Python
- 21. String.Format no convierte enteros correctamente en árabe
- 22. ¿Cómo puedo cin y cout algún texto Unicode?
- 23. UILocalizedIndexedCollation para japonés que ordena diferentes contactos/aplicaciones de música
- 24. mostrando fuentes en árabe en QtWebKit
- 25. Solr para árabe
- 26. Algoritmos de ajuste de palabras para japonés
- 27. Soporte URDU o árabe en android para emulador y dispositivo
- 28. Insertar y seleccionar datos en árabe Android SQLite
- 29. ¿Hay alguna forma de comprobar si el texto Unicode está en un idioma determinado?
- 30. Multilingüe Unicode en OpenGL
No veo qué tiene que ver específicamente con el iPhone. –
Los caracteres en árabe y japonés son parte del alfabeto árabe y japonés. Creo que algunas personas podrían tomar su pregunta como un insulto. – johannes
@johannes: No creo que "alfabetizar" signifique "convertir a un alfabeto inglés", sino "ordenar en un orden apropiado". –