Я знаю, что на вопрос уже дан ответ, и ответ помечается как принятый ответ, но я думаю, что есть другой способ получить то, что было задано:
JSoup предлагает ownText()
метод.с этим вы можете получить все текстовые узлы элемента, которые являются прямыми потомками элемента.Дочерние элементы и их текстовые узлы не возвращаются.
Document doc = Jsoup.parse("<body> text <p> not included </p> included </body>");
Element body = doc.body();
String ownText = body.ownText();