Cleaner всегда будет сбрасывать теги и сохранять текст.Если вам нужно удалить элементы (т. Е. Теги и текстовые / вложенные элементы), вы можете предварительно проанализировать HTML-код, удалить элементы с помощью remove()
или empty()
, затемпропустите полученный результат через очиститель.
Например:
String html = "Clean <div>Text dropped</div>";
Document doc = Jsoup.parse(html);
doc.select("div").remove();
// if not removed, the cleaner will drop the <div> but leave the inner text
String clean = Jsoup.clean(doc.body().html(), Whitelist.basic());