Методы DOM для навигации по документу с помощью getElementByTag - PullRequest
0 голосов
/ 17 апреля 2019

Я читаю данные со страницы html в моей java-программе, используя JSOUP API, и извлекаю значение с помощью ElementByTag ("H3"), где я получаю все значения этого тега, а не вопрос о том, что я не хочу значение дочернего тегачто я получаю в списке Outlook значение

Java-код для чтения значения

Element instrumentContent = doc.select("div.comp-fs-instrument-content").get(i);
                if (null != instrumentContent) {

                    Elements elementsByTag = instrumentContent.getElementsByTag("LI");
                    Elements instrumentCategory = elementsByTag.get(0).getElementsByTag("H4");
                    Elements Ratings = elementsByTag.get(1).getElementsByTag("H4");
                    Elements Outlook = elementsByTag.get(2).getElementsByTag("H4");
                    System.out.println("Outlook======" + Outlook);

                    strInstrument = Optional.ofNullable(instrumentCategory).filter(s -> !s.isEmpty())
                            .map(s -> s.first().html()).orElse("-");
                    strRating = Optional.ofNullable(Ratings).filter(s -> !s.isEmpty()).map(s -> s.first().html())
                            .orElse("-");

                    strOutlook = Optional.ofNullable(Outlook).filter(s -> !s.isEmpty()).map(s -> s.first().parent().html())
                            .orElse("-");

                }

Ввод HTML-кода

<div class="comp-fs-instrument-content"> 
            <ul class="clearfix"> 
             <li prid="164910"> <span>Instrument Category</span> <h4>Long Term</h4> </li> 
             <li> <span>Ratings</span> <h4>CRISIL B- (Issuer Not Cooperating)</h4> </li> 
             <!-- Updated on 5th May start--> 
             <li class="third-col"> <span>Outlook</span> <h4>Stable <span> as of October 24, 2018</span></h4> </li> 
             <!-- Updated on 5th May ends--> 
             <li class="view-instr-btn text-center"> <a href="javascript:;" class="view-instr-button">View Instrument</a> </li> 
            </ul> 
           </div> 

Вывод, который я получаю ......

Stable <span> as of October 23, 2018</span>

Мне нужно вот так

Stable 
...