Как отсортировать китайские строки по инсульту в Java? - PullRequest
6 голосов
/ 12 января 2012

Есть ли в Java библиотека для сортировки китайских строк по штрихам?

Ответы [ 2 ]

3 голосов
/ 12 января 2012

Попробуйте java.text.Collator для китайского Locale.

2 голосов
/ 14 января 2012

Если вы хотите свернуть код самостоятельно, одним из источников данных являются поля Radical-Stroke Counts базы данных Unihan из Консорциума Unicode.Ссылка на раздел Технического отчета 38 с описанием этих полей.

Обратите внимание, что количество штрихов идеографического символа основывается на структуре (или морфологии) отображаемого символа, то есть на его глифе.Морфология глифа является функцией стиля дизайна шрифта - особенно, если шрифт следует традиционным китайским, упрощенным китайским или японским соглашениям.Но коды символов в Java обычно основаны на стандарте Unicode, который объединяет символы всех этих соглашений в единый символьный код.

Итак, вам понадобится внешняя информация, чтобы сообщить вам, какое соглашение использует ваш текст.Это в свою очередь говорит вам, какое поле базы данных Unihan использовать.Если вы знаете, что все текстовые строки на китайском языке упрощены, или все на традиционном китайском, то у вас достаточно информации.

Также ознакомьтесь с Веб-API китайских иероглифов , который обслуживает данные изБаза данных Unihan.

Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...