вы можете создать суп, useful_text
и как только суп был создан, поскольку документация объяснит , вы можете go вверх и вниз по дереву, выбрав tags
, в этом случае Я выбрал тег td
, и если в нем несколько строк, я буду использовать функцию get_text()
.
from bs4 import BeautifulSoup, SoupStrainer
html = '''<tr>
<td>
usefultext
<img src='imgsrc' alt='*'>
</td>
</tr>'''
useful_text = BeautifulSoup(html)
useful_text.td.get_text()
[out]:
'\n usefultext\n \n'
Если у вас несколько тегов td
, вы захотите использовать функцию next_siblings
.
Очень рекомендую прочитать документацию и поиграться.