Как определить язык персонажа в Ruby / Rails? - PullRequest
1 голос
/ 10 мая 2011

Учитывая символ (одна буква строки), как я могу определить, к какому языку он принадлежит?Доступны следующие варианты: английский, русский, иврит.

Фон: этот символ был введен пользователем в форму и затем сохранен в базе данных.

Это может быть, например, первая буква в одномиз этих слов:

  • Привет
  • Привет
  • שלום

1 Ответ

3 голосов
/ 10 мая 2011

Стандарт UNICODE разделен на " блоки ". Иди сюда:

http://www.unicode.org/charts/

http://en.wikipedia.org/wiki/Unicode_block

http://www.unicode.org/versions/Unicode6.0.0/

и найдите юникодные блоки (интервалы) для каждого языка.

Мое предположение:

Так что для вас это вопрос простого сравнения чисел для каждого символа (порядковый номер Unicode) Очень просто.

Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...