В jsoup 1.6 я переписал HTML-парсер для реализации whatwg HTML-спецификации , которая соответствует тому, как браузеры в настоящее время анализируют HTML.
Эффект здесь заключается в том, что в 1,5 достаточно <td>
, чтобы автоматически оживить <table>
; однако браузеры на самом деле не работают таким образом, поэтому в версии 1.6 вам необходимо обновить ввод HTML, чтобы ввести тег <table>
.
Например:
System.out.println(
Jsoup.parseBodyFragment("<table><td>123</td></table>").html());
даст:
<html>
<head></head>
<body>
<table>
<tbody>
<tr>
<td>123</td>
</tr>
</tbody>
</table>
</body>
</html>
Обратите внимание, что <table><td>
нормализуется до <table><tbody><tr><td>...
.
Надеюсь, это поможет!