¿Cómo se clasifican los caracteres chinos, japoneses y coreanos (CJK) en Perl?¿Cómo se clasifican los caracteres CJK (asiáticos) en Perl, o con cualquier otro lenguaje de programación?
Por lo que puedo decir, la clasificación de los caracteres CJK por trazo, luego por radical, parece ser la forma en que se ordenan estos idiomas. También hay algunos métodos que ordenan por sonidos, pero esto parece menos común.
He intentado usar:
perl -e 'print join(" ", sort qw(工 然 一 人 三 古 二)), "\n";'
# Prints: 一 三 二 人 古 工 然 which is incorrect
Y he intentado usar Unicode :: Intercalar de CPAN, pero dice:
Por defecto, CJC Unificado Ideographs son ordenados en Orden de punto de código Unicode ...
Si pudiera obtener una base de datos del recuento de trazos por carácter, podría ordenar fácilmente todos los caracteres, pero esto d Parece que no viene con Perl ni está encapsulado en ningún módulo que pueda encontrar.
Si sabe cómo clasificar CJK en otros idiomas, sería útil mencionarlo en una respuesta a esta pregunta.
Esta es una pregunta tonta. "¿Cómo clasificas las palabras en chino?" o "¿Cómo clasificas las palabras coreanas?" tendría sentido, pero "¿Cómo clasificas los personajes de CJK?" no tiene ningún sentido. –
Tiene mucho sentido, porque en la mayoría de los charmaps compatibles con varios idiomas asiáticos, el chino, el japonés y el coreano se agrupan en "CJK". – Andy