Web Scraping содержимого :: before :: after CSS элемента Psuedo с использованием BeautifulSoup - PullRequest
0 голосов
/ 22 октября 2018

Я изучаю веб-скребинг.Я хотел бы знать, как мы можем получить количество участников из элемента ниже?

<li class="header-hero__stat header-hero__stat--participants">
   ::before
   "255,590 Participants"
   ::after
</li>

Код, который я пробовал

soupy = bs(html,'lxml') 
ul = soupy.find('li',{'class':"header-hero__stats"})

возвращает None

Целевая страница

1 Ответ

0 голосов
/ 22 октября 2018

Это не содержимое псевдоэлементов, а текстовое содержимое узла li, поэтому

li = soup.find('li',{'class':"header-hero__stat--participants"}).text

должно быть достаточно для извлечения '255,601 Participants'

Используйте .text.split()[0] дляполучить только номер

Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...