Я хочу очистить несколько URL, которые имеют 2 divs
, используя те же class="description"
,
Исходный код примера URL выглядит следующим образом:
<!-- Initial HTML here -->
<div class="description">
<h4> Anonymous Title </h4>
<div class="product-description">
<li> Some stuff here </li>
</div>
</div>
<!-- Middle HTML here -->
<div class="description">
Some text here
</div>
<!-- Last HTML here -->
I 'Я удалил его, используя BeautifulSoap, используя следующий скрипт
# imports etc here
description_box = soup.find('div', attrs={'class': 'description'})
description = description_box.text.strip()
print description
При запуске он дает мне первый div
только с class="description"
, однако я хочу второй div
только с class="description"
.
Любые идеи, как я могу игнорировать первый div
и просто очистить второй?
PS Первый div
всегда имеет h4
тегов, а второй div
имеет только простой текст между тегами.