Текст внутри BR не извлекается с помощью Python Beautifulsoup - PullRequest
1 голос
/ 11 апреля 2019

Я хотел бы получить все данные внутри div под тегами br. однако это только выборка текста на первом.

<div itemprop="description">

<p>Chars :
</br>- test1 
</br>- test2 
</br>- test3
</p>

</div>

Сценарий:

tag = soup.find(itemprop="description").get_text()

Выход:

Chars
-test1

Я хочу получить весь текст внутри br

1 Ответ

0 голосов
/ 11 апреля 2019

У меня не было проблем с lxml и выберите

from bs4 import BeautifulSoup as bs
html = '''
<div itemprop="description">

<p>Chars :
</br>- test1 
</br>- test2 
</br>- test3
</p>

</div>
'''
soup = bs(html, 'lxml')
data = [item.text.strip().replace('\n',' ') for item in soup.select('div[itemprop=description]')]
print(data)
Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...