Python утилизация не возвращает ни одного - PullRequest
0 голосов
/ 06 января 2020

Я пытаюсь взять имя со страницы HTML с BeautifulSoup:

import urllib.request
from bs4 import BeautifulSoup

nightbot = 'https://nightbot.tv/t/tonyxzero/song_requests'
page = urllib.request.urlopen(nightbot)
soup = BeautifulSoup(page, 'html5lib')

list_item = soup.find('strong', attrs={'class': 'ng-binding'})
print (list_item)

Но когда я печатаю print(list_item), я получаю none в качестве ответа. Есть способ это исправить?

1 Ответ

2 голосов
/ 06 января 2020

Веб-страница отображается javascript. Поэтому вы должны использовать пакет типа selenium, чтобы получить то, что вы хотите.

Вы можете попробовать это:

КОД:

import urllib.request
from bs4 import BeautifulSoup
from selenium import webdriver

driver = webdriver.Firefox()
driver.get('https://nightbot.tv/t/tonyxzero/song_requests')

html = driver.page_source

soup = BeautifulSoup(html, 'html.parser')

list_item = soup.find('strong', attrs={'class': 'ng-binding'})
print (list_item)

РЕЗУЛЬТАТ:

<strong class="ng-binding" ng-bind="$state.current.title">Song Requests: TONYXZERO</strong>
Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...