Хранение HTML-кодов (например, Ø) в виде букв - PullRequest
1 голос
/ 08 ноября 2010

Мне нужно прочитать некоторые тестовые данные из HTML-документа.Проблема в том, что там присутствуют некоторые неанглийские символы в виде HTML-кодов (например, Ø - * ​​1001 *).Как я могу изменить их в один персонаж?Позже мне нужно сравнить эти символы с тем, что пользователь вводит в веб-форме.

Я пытаюсь сделать это в Ruby 1.9.2.

Заранее спасибо

1 Ответ

1 голос
/ 08 ноября 2010

Этот вопрос был на ТАК много раз.Но я не могу найти это.Итак, насколько я помню:

require 'CGI'
some_string = 'Ø&>'
p CGI.unescapeHTML(some_string).gsub(/&#(\d+);/){[$1.to_i].pack 'U'}

=> "\u00D8&>"

\u00D8 - ваш символ.&> только для примера использования CGI::unescapeHTML.

Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...