Я читаю данные со страницы html в моей java-программе, используя JSOUP API, и извлекаю значение с помощью ElementByTag ("H3"), где я получаю все значения этого тега, а не вопрос о том, что я не хочу значение дочернего тегачто я получаю в списке Outlook значение
Java-код для чтения значения
Element instrumentContent = doc.select("div.comp-fs-instrument-content").get(i);
if (null != instrumentContent) {
Elements elementsByTag = instrumentContent.getElementsByTag("LI");
Elements instrumentCategory = elementsByTag.get(0).getElementsByTag("H4");
Elements Ratings = elementsByTag.get(1).getElementsByTag("H4");
Elements Outlook = elementsByTag.get(2).getElementsByTag("H4");
System.out.println("Outlook======" + Outlook);
strInstrument = Optional.ofNullable(instrumentCategory).filter(s -> !s.isEmpty())
.map(s -> s.first().html()).orElse("-");
strRating = Optional.ofNullable(Ratings).filter(s -> !s.isEmpty()).map(s -> s.first().html())
.orElse("-");
strOutlook = Optional.ofNullable(Outlook).filter(s -> !s.isEmpty()).map(s -> s.first().parent().html())
.orElse("-");
}
Ввод HTML-кода
<div class="comp-fs-instrument-content">
<ul class="clearfix">
<li prid="164910"> <span>Instrument Category</span> <h4>Long Term</h4> </li>
<li> <span>Ratings</span> <h4>CRISIL B- (Issuer Not Cooperating)</h4> </li>
<!-- Updated on 5th May start-->
<li class="third-col"> <span>Outlook</span> <h4>Stable <span> as of October 24, 2018</span></h4> </li>
<!-- Updated on 5th May ends-->
<li class="view-instr-btn text-center"> <a href="javascript:;" class="view-instr-button">View Instrument</a> </li>
</ul>
</div>
Вывод, который я получаю ......
Stable <span> as of October 23, 2018</span>
Мне нужно вот так
Stable