Сохранять пробелы при разборе HTML с помощью Jsoup - PullRequest
0 голосов
/ 08 апреля 2020

Я работаю с Jsoup 1.13.1 и хотел бы сохранить пробелы при разборе ввода HTML. Рассмотрим следующий пример:

...
<p>a<br>
    b
</p>
...

После синтаксического анализа (и выбора) элемента p у меня есть четыре варианта доступа к его содержимому:

Element e = ... // find p element
e.html(); // "a<br> b"
e.text(); // "a b"
e.wholeText(); // "a\n\tb\n"
e.toString(); // "<p>a<br> b </p>"

Однако ни одно из этих действий не является ищу ... Я хотел бы получить "a<br>\n\tb\n", в основном вариант wholeHtml ... Результаты toString создают впечатление, что пробел уже потерян во время синтаксического анализа, так что, если вообще, я бы предположим, что мне нужно настроить параметры конфигурации перед синтаксическим анализом, но я не смог их найти.

Кто-нибудь знает, как мне добиться функциональности метода wholeHtml?

...