Мне нужно удалить данные с веб-страницы в этом формате.Мне нужен только внутренний текст первого дочернего элемента h2 и h3, т. Е. Из первого диапазона и всех других тегов <p>
<div class="info">
<h2>
<span>first heading</span>
<span> not required</span>
</h2>
<p> 1 paragraph</p>
<p> 2 paragraph</p>
<div> some tags</div>
<h3>
<span>second heading</span>
<span> not required</span>
</h3>
<p> 3 paragraph</p>
<p> 4 paragraph</p>
</div>
Outputs;
first heading
1 paragraph
2 paragraph
second heading
3 paragraph
4 paragraph
soup.find_all (["h1 "," p "," h2 "," h3 "]) после попытки этого я также получаю внутренний текст второго интервала, который мне не нужен.Мне нужен только внутренний текст содержимого первого диапазона h2 и h3 'и содержимого тега p.Я новичок в питоне и супе, любая помощь будет оценена.