2012-01-12 11 views

Respuesta

3

Pruebe java.text.Collator para chino Locale.

+2

Gracias. Parece 'Locale.SIMPLIFIED_CHINESE' ordenado por chino Pinyin pero' Locale.TRADITIONAL_CHINESE' ordenado por trazo. – bydsky

+0

No tengo idea de qué es el pinyin o el trazo, pero me alegro de que haya sido útil. –

2

Si desea pasar el código usted mismo, una fuente para los datos son los campos Radical-Stroke Counts de la base de datos de Unihan, del Consorcio Unicode. El enlace es a la sección del Informe técnico 38, que describe esos campos.

Tenga en cuenta que el recuento de trazo de un carácter ideográfico se basa en la estructura (o morfología) del carácter tal como se muestra, es decir, su glifo. La morfología del glifo es una función del estilo de diseño de la fuente, especialmente si la fuente sigue las convenciones tradicional china, simplificada china o japonesa. Pero los códigos de caracteres en Java generalmente se basan en el estándar Unicode, que unifica los caracteres de todas estas convenciones bajo un solo código de carácter.

Por lo tanto, necesitará información externa para decirle qué convención está usando su texto. Esto, a su vez, le indica qué campo de la base de datos de Unihan debe usar. Si sabe que sus cadenas de texto chinas están todas simplificadas, o todo chino tradicional, entonces tiene suficiente información.

Consulte también Chinese Character Web API, que sirve datos de la base de datos de Unihan.

Cuestiones relacionadas