HTMLEntities декодирует в ASCII 194, не должно ли быть 160? - PullRequest
2 голосов
/ 18 июля 2011

Я использую HTMLEntities для декодирования HTML-строк.Сегодня я увидел, что декодируется до 194 вместо 160.

jruby-1.6.2 :002 > HTMLEntities.new.decode( " " )[0]
 => 194 

Правильно ли 194, или я что-то не так делаю (возможно, что-то с UTF-8-Strings в Ruby)?

(JRuby = 1.6.2, Rails = 2.3.11, HTMLEntities = 4.3.0)

1 Ответ

3 голосов
/ 18 июля 2011

То, что вы видите, является первым байтом двухбайтовой последовательности UTF-8. Попробуйте распаковать его, чтобы увидеть ожидаемый код Unicode:

HTMLEntities.new.decode( " " ).unpack('U*')[0]
...