Ошибка разбора Jsoup (таблица тегов в теге p) - PullRequest
0 голосов
/ 03 апреля 2012

Когда я анализирую этот код с помощью Jsoup:

<p>
<table>[...]</table>
</p>

Jsoup возвращает:

<p></p>
<table>[...]</table>

Это ошибка? Как я могу это исправить?

Ответы [ 2 ]

0 голосов
/ 11 марта 2014

jsoup очень умный. Он преобразует ваш входной текст в действительное HTML-содержимое, если вы используете его метод синтаксического анализа по умолчанию.

Document doc = Jsoup.parse(html);

На самом деле, jsoup может обрабатывать текст, похожий на xml (конечно, включая html и xml). Вы можете попробовать следующий метод для анализа xml-подобного текста. Он не изменит ваш ввод и не проанализирует ввод как есть.

Document doc = Jsoup.parse(html, "", Parser.xmlParser());

0 голосов
/ 03 апреля 2012

Я думаю, это связано с тем, что ваш пример не является "действительным" html.Я считаю, что таблица не может существовать в теге ap.Jsoup, вероятно, применяет правильный HTML.

...