Я новичок в изучении веб-страниц. Я пытаюсь использовать красивый суп и селен, чтобы соскрести цифры с динамически загруженного сайта.
Вот мой код:
from selenium import webdriver
import bs4
from bs4 import BeautifulSoup
driver=webdriver.Chrome()
driver.get('https://roobet.com/crash')
html = driver.page_source
soup = BeautifulSoup(html,features="html5lib")
crash = soup.find('div', class_='CrashHistory_2YtPR')
num = crash.div.text
num.replace('x','')
print(num)
, когда я запускаю его, используя '' 'python testcra sh .py' '' в командной строке, которую я получаю.
DevTools listening on ws://127.0.0.1:7628/devtools/browser/fb52b5de-1423-488a-a4dd-8442deff01d2
[34012:34760:0423/201837.291:ERROR:browser_switcher_service.cc(238)] XXX Init()
Traceback (most recent call last):
File "testcrash.py", line 10, in <module>
num = crash.div.text
AttributeError: 'NoneType' object has no attribute 'div'
но когда я запускаю код построчно в python приложении, я получаю то, что мне нужно. Вот как это выглядит
Python 3.8.2 (tags/v3.8.2:7b3ab59, Feb 25 2020, 22:45:29) [MSC v.1916 32 bit (Intel)] on win32
Type "help", "copyright", "credits" or "license" for more information.
>>> from selenium import webdriver
>>> import bs4
>>> from bs4 import BeautifulSoup
>>> driver=webdriver.Chrome()
DevTools listening on ws://127.0.0.1:4917/devtools/browser/887f1d53-d7d1-4a56-929b-bf46e13cff9d
[8592:31756:0423/171506.777:ERROR:browser_switcher_service.cc(238)] XXX Init()
>>>
>>> driver.get('https://roobet.com/crash')
>>> html = driver.page_source
>>> soup = BeautifulSoup(html,features="html5lib")
>>> crash = soup.find('div', class_='CrashHistory_2YtPR')
>>> num = crash.div.text
>>> num
'2.38x'
>>>
Вот снимок экрана страницы и объекта, который я пытаюсь очистить: