Как вы сортируете символы китайского, японского и корейского (CJK) в Perl?
Насколько я могу судить, сортировка символов CJK по количеству штрихов, а затем по радикалам, кажется, способ сортировки этих языков. Есть также некоторые методы, которые сортируют по звукам, но это кажется менее распространенным.
Я пытался использовать:
perl -e 'print join(" ", sort qw(工 然 一 人 三 古 二 )), "\n";'
# Prints: 一 三 二 人 古 工 然 which is incorrect
И я пытался использовать Unicode :: Collate из CPAN, но он говорит:
По умолчанию унифицированные идеографы CJK
упорядочено в порядке кодировки Unicode ...
Если бы я мог получить базу данных числа ударов на символ, я мог бы легко отсортировать все символы, но, похоже, это не идет с Perl и не заключено в какой-либо модуль, который я смог найти.
Если вы знаете, как сортировать CJK на других языках, было бы полезно упомянуть об этом в ответе на этот вопрос.