Уберите значения из HTML с Beautifulsoup - PullRequest
0 голосов
/ 07 февраля 2019

Попытка удалить из

<h3 class="s-item__title s-item__title--has-tags" role="text"><div><div class="s-item__title-tag">Nov 14, 2018</div></div>Text I Want</h3>

Мне нужны значения: 14 ноября 2018 г., Текст, который я хочу

Я пытался, но не могу получить это второе значение.

1 Ответ

0 голосов
/ 07 февраля 2019

Я использовал генератор строк , чтобы захватить все строки в html и сохранить в списке:

from bs4 import BeautifulSoup

html = """<h3 class="s-item__title s-item__title--has-tags" role="text"><div><div class="s-item__title-tag">Nov 14, 2018</div></div>Text I Want</h3>)"""

bs = BeautifulSoup(html, 'html.parser')
text = [s for s in bs.h3.strings]

text

['Nov 14, 2018', 'Text I Want']
Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...