с учетом отсутствия родителя в селекторе jsoup - PullRequest
0 голосов
/ 29 января 2019

Я хочу получить книги с веб-сайта, но этот веб-сайт использует другой HTML, чтобы показать то же самое.На некоторых страницах он имеет div, за которым следует ul, а затем li, например:

<div class="book-description">
   <ul>
      <li>info 1</li>
      <li>info 2</li>
      <li>info 3</li>
   </ul>
</div>

Чтобы перебрать li, я бы просто сделал: doc.select("div.book-description > ul > li")

В других случаях он напрямую переходит от div к li, например:

<div class="book-description">
   <li>info 1</li>
   <li>info 2</li>
   <li>info 3</li>
</div>

Предыдущий синтаксис не будет работать с этой страницей, мне нужно будет использовать doc.select("div.book-description > li") Isесть синтаксис, который я могу использовать, чтобы указать, что ul может отсутствовать?

1 Ответ

0 голосов
/ 29 января 2019

Вы пробовали doc.select("div.book-description li")?

Если в вашем списке нет вложенных списков, этот селектор будет в порядке.

...