Как получить данные из вложенного HTML с помощью BeautifulSoup в Django - PullRequest
0 голосов
/ 13 апреля 2020

Я пытаюсь научиться просматривать веб-страницы, и я застрял в точке, в которой нужные мне данные обернуты тегом div следующим образом:

<div class="maincounter-number">
<span style="color:#aaa">803 </span>
</div>

Есть несколько таких данных, и мне нужно все (например, 803). Я думаю, мне нужно сделать soup.find_all(...), но я не знаю, что положить внутрь. Кто-нибудь поможет?

Я работаю в python (Django.)

1 Ответ

1 голос
/ 13 апреля 2020

Это должно сделать то, что вы хотите сделать:

from bs4 import BeautifulSoup

html_doc = '<div class="maincounter-number"><span style="color:#aaa">803 </span></div>'

soup = BeautifulSoup(html_doc, 'html.parser')
print(soup.find_all('span', {'style': 'color:#aaa'})[0].get_text())

Если вы просто хотите запросить текст в div и выполнить поиск по классу:

print(soup.find_all('div', {'class': 'maincounter-number'})[0].get_text())
Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...