Он не находит их всех, потому что вы не просили его об этом. find
вернет только первое вхождение. Если вы хотите очистить все теги <p>
в теге <div class="entry-content">
, вы должны использовать метод findAll
.
div = soup.findAll('div', attrs={"class":"entry-content"})
for x in div:
p_tags = x.findAll('p')
# Print every `p` tag's content
article_content = '---\n'.join(map(lambda p: p.getText(), p_tags))
print(article_content)