Ruby HTML Unicode для реальных символов - PullRequest
2 голосов
/ 13 февраля 2011

Я пытаюсь преобразовать ссылки на цифровые символы HTML в строку. Пример:

イス シート 椅子

Символам, которые они представляют (извините, если это не правильно для вас): イ ス シ ー ト 椅子

Я пробовал следующее: CGI::unescapeHTML(str), но я все еще вижу коды цифровых символов, а не символы.

Я попытался записать вывод в файл (на тот случай, если он просто неправильно отображает в терминале) и открыть его с помощью TextEdit / vim, но это не помогло.

1 Ответ

5 голосов
/ 13 февраля 2011

Вы можете использовать камень htmlentities . Также необходимо учитывать шестнадцатеричное представление (например, イ совпадает с イ или "& # x30a4;"). Нет веской причины делать это вручную (и, возможно, пропустить различные крайние случаи и нотации, о которых вы могли не знать), когда есть полная и протестированная библиотека, которая сделает это за вас.

Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...