Библиотека Java JSoup element.text () возвращает '' как символ ASCII # 160 - PullRequest
1 голос
/ 18 января 2012

Я только недавно столкнулся со странным поведением библиотеки JSoup 1.3.3 (довольно старой, я знаю).

При синтаксическом анализе текстового узла, который содержит   сущность, он преобразуется путем вызова .text () для этого элемента в # 160 ASCII char .

Вы испытали это? Как вы думаете, это правильное поведение? (проверено Jsoup-репо на наличие ошибок, не найдено)

Спасибо

Jan

1 Ответ

3 голосов
/ 18 января 2012

Неразрывный пробел не такой же, как нормальный пробел.Непрерывный пробел составляет 0xA0 или 160 в десятичном формате в ISO-8859- *, Windows-1252, это U + 00A0 в Unicode (в UTF-8 он кодируется в 0xC2 0xA0).Поэтому, в зависимости от вашей точной кодировки, это правильное поведение.

...