Получит весь текст в элементах <p>
, но не получит его ни от одного из дочерних элементов в <p>
.Рекурсив должен быть равен false, иначе он будет смотреть на дочерние элементы.Я добавил в другом тестовом примере, чтобы вы показали это: <p><h4>Heading</h4></p>
from bs4 import BeautifulSoup
html = "<p> <img src='any url'/> </p> <p><h4>Heading</h4></p> <p> hello world </p>"
soup = BeautifulSoup(html)
for element in soup.findAll('p'):
print("".join(element.findAll(text=True, recursive=False)))