Извлечение текста из класса с помощью Beautifulsoup - PullRequest
0 голосов
/ 29 апреля 2019
<a class="mdl-navigation__link" href="#StringFormatInvalid">
<i class="material-icons error-icon">error</i>Invalid format string (1)</a>

Все интересующие элементы обозначены тегом, но я хочу извлечь текст из этого тега. Как я должен продолжать об этом?

1 Ответ

0 голосов
/ 29 апреля 2019

Мы не знаем, нужен ли вам текст внутри тега <i> или весь текст внутри тега <a>.

В любом случае, вот фрагмент кода для поиска обоих:

from bs4 import BeautifulSoup
import requests

html = """<a class="mdl-navigation__link" href="#StringFormatInvalid">
<i class="material-icons error-icon">error</i>Invalid format string (1)</a>"""

soup = BeautifulSoup(html, 'html.parser')

a = soup.find('a', {'class': 'mdl-navigation__link'})
i = soup.find('i', {'class': 'material-icons error-icon'})

print('a text = ', a.get_text())
print('i text = ', i.get_text())

ВЫХОД:

a text =  
errorInvalid format string (1)

i text =  error
Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...