Разбор конкретных значений p с помощью jsoup - PullRequest
0 голосов
/ 07 октября 2019

У меня есть следующий фрагмент гораздо более длинной страницы:

<h2 id="Supportedplatforms-Java">Java</h2> 
 <section class="layout-section layout-section-two_equal"> 
  <div class="content-section"> 
   <p><strong>Oracle JRE / JDK:</strong></p>
   <p><img alt="(tick)" data-emoticon-name="tick" class="emoticon emoticon-tick" src="/s/en_GB/7202/e97769bbf919c0bd667762fc102f557beacb7f94/_/images/icons/emoticons/check.png">&nbsp;Java 8</p>
   <p><img alt="(tick)" data-emoticon-name="tick" class="emoticon emoticon-tick" src="/s/en_GB/7202/e97769bbf919c0bd667762fc102f557beacb7f94/_/images/icons/emoticons/check.png">&nbsp;Java 11</p>
   <p><strong>OpenJDK:</strong></p>
   <p><strong><img alt="(tick)" data-emoticon-name="tick" class="emoticon emoticon-tick" src="/s/en_GB/7202/e97769bbf919c0bd667762fc102f557beacb7f94/_/images/icons/emoticons/check.png">&nbsp;</strong>Java 8</p>
   <p><img alt="(tick)" data-emoticon-name="tick" class="emoticon emoticon-tick" src="/s/en_GB/7202/e97769bbf919c0bd667762fc102f557beacb7f94/_/images/icons/emoticons/check.png">&nbsp;Java 11</p> 
  </div> 
<div class="content-section"> = $0

Все, что мне нужно, это следующий результат:
Oracle JRE / JDK:
Java 8
Java 11
OpenJDK:
Java 8
Java 11

Я использую jsoup в groovy:

import org.jsoup.Jsoup;
import org.jsoup.nodes.Document;
import org.jsoup.nodes.Element;
import org.jsoup.select.Elements;
def url = "https://url";
def document = Jsoup.connect(url).get()

Я пытался последние несколько часов безрезультатно, с

Elements test = document.select("#Supportedplatforms-Java > p")

... И сотни вариантов

Если у вас есть указатель, я был бы рад услышать об этом!

Спасибо

1 Ответ

0 голосов
/ 07 октября 2019

Elements test = document.select(".layout-section .content-section p")

...