Я хочу получить книги с веб-сайта, но этот веб-сайт использует другой HTML, чтобы показать то же самое.На некоторых страницах он имеет div
, за которым следует ul
, а затем li
, например:
<div class="book-description">
<ul>
<li>info 1</li>
<li>info 2</li>
<li>info 3</li>
</ul>
</div>
Чтобы перебрать li
, я бы просто сделал: doc.select("div.book-description > ul > li")
В других случаях он напрямую переходит от div
к li
, например:
<div class="book-description">
<li>info 1</li>
<li>info 2</li>
<li>info 3</li>
</div>
Предыдущий синтаксис не будет работать с этой страницей, мне нужно будет использовать doc.select("div.book-description > li")
Isесть синтаксис, который я могу использовать, чтобы указать, что ul
может отсутствовать?