Я использую Jsoup, чтобы попытаться очистить почти все html из документа, кроме белого списка, тега span с конкретным классом .
У меня есть это, но, очевидно, это заканчивается разрешением всех промежутков с классом attr
String html = "<p><strong>Lorem ipsum dolor<br /> sit amet</strong></p>"+
"<span class=\"killme\">Aenean</span> quam sem" +
"<span class=\"whitelistme\">lacinia molestie</span> nibh mattis ";
String clean = Jsoup.clean(html,
Whitelist.none()
.addTags("span")
.addAttributes("span", "class"));
Есть ли способ очистить все HTML, кроме ?
, поэтому мойконечный результат будет
Lorem ipsum dolor sit amet
Aenean quam sem
<span class="whitelistme">lacinia molestie</span> nibh mattis