У меня есть html-страница, на которой (помимо прочего) есть следующие элементы Div:
<div id="fact">
<div class="fact">
AAAAAA
<div class="fact-label">
BBBBBB
</div>
</div>
</div>
Я хочу извлечь только текст div, который имеет class = "fact"
Код:
Document page = Jsoup.connect(url).get();
Elements element = page.select("div.fact");
for (Element step : element) {
System.out.println(step.getElementsByAttributeValueMatching("class",
Pattern.compile("^[a-t]{4}$")));
}
но это не работает, я получаю следующее:
<div class="fact">
AAAAAA
<div class="fact-label">
BBBBBB
</div>
</div>
Мой вопрос: как я могу исключить внутренний Div, который имеет class = "fact-ярлык "?