Алфавитно-арабский и японский текст, который есть в Unicode? - PullRequest
5 голосов
/ 02 марта 2010

У кого-нибудь есть какой-нибудь код для алфавитного арабского и японского текста, который есть в Unicode? Если бы код был в ruby, это было бы здорово.

Ответы [ 5 ]

4 голосов
/ 19 марта 2010

Кодовые точки Unicode не перечислены в алфавитном порядке (например, Z Unicode Collation Algorithm , и они также зависят от языка (французский порядок не совсем совпадает с немецким или чешским, даже с тем же алфавитом), который может быть указано в информации о локали. Я думаю, что ICU библиотека содержит алгоритмы для конкретного языка, которые вы ищете.

0 голосов
/ 18 марта 2010

mylist.sort должен работать из коробки в Ruby 1.9 (который имеет встроенную поддержку юникода). В Ruby 1.8, где поддержка Unicode не встроена, я думаю, вам нужно использовать гем character-encodings, расширяющий класс String с помощью сравнения строк UTF-8. (И тогда mylist.sort будет работать.)

0 голосов
/ 02 марта 2010

Чтобы задать очевидный вопрос, что вам не нравится в mylist.sort?

0 голосов
/ 03 марта 2010

В зависимости от ваших потребностей words.sort в рубине будет хорошо для японского языка. Порядок отображения символов в Юникоде находится в достаточно хорошем порядке сортировки. Хотя я не могу поручиться за арабский язык, но я думаю, что все в порядке.

0 голосов
/ 02 марта 2010

Я не знаю Ruby, но в python есть функция ord (), которая переводит специальный символ Юникода в его кодовую точку Юникода.Например,

>>> a = u'ل'
>>> ord(a)
0: 1604
>>> b = u'ع'
>>> ord(b)
1: 1593

Найдите что-то подобное в Ruby.Я предполагаю, что арабские символы перечислены в юникоде в алфавитном порядке.

Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...