Мне нужна помощь по очистке веб-страниц.Вот пример HTML:
<div class="content" name="content-name">
<h2 class="Topic">First Topic</h2>
<ul>
<li>This Data 1</li>
<li>This Data 2</li>
<li>This Data 3</li>
</ul>
<h2 class="Topic">Second Topic</h2>
<ul>
<li>That Data 1</li>
<li>That Data 2</li>
<li>That Data 3</li>
</ul>
<h2 class="Topic">Third Topic</h2>
<ul>
<li>Their Data 1</li>
<li>Their Data 2</li>
<li>Their Data 3</li>
</ul>
</div>
Используя BeautifulSoup, я мог получить тег html div для name = "content-name".Но как мне получить весь текст с тегом li внутри ul после тега h2 , который имеет текст «второй темы»?Потому что все это находится в одном теге div без определенного класса, идентификатора или имени.Заранее спасибо.