Пытаясь получить html на открытой странице - PullRequest
0 голосов
/ 02 февраля 2020

Я пытаюсь создать бота, который сможет играть в Cook ie Clicker. Я успешно открыл сайт с помощью модуля веб-браузера. Когда я использую инструмент разработчика, чтобы увидеть html, я вижу информацию, которую хочу получить, например, сколько у меня денег, сколько стоят дорогие вещи. Но когда я пытаюсь получить эту информацию, используя запросы и beautifulsoup, вместо этого она получает html нового окна. Как сделать так, чтобы я получил html уже открытой вкладки?

import webbrowser
webbrowser.open('https://orteil.dashnet.org/cookieclicker/')

from bs4 import BeautifulSoup
import requests

def scrap():
    html = requests.get('https://orteil.dashnet.org/cookieclicker/')
    print(html)

scrap()

1 Ответ

0 голосов
/ 02 февраля 2020

Вы можете попробовать сделать это:

body_element = html.find_element_by_xpath("//body")    
body_content = body_element.get_attribute("innerHTML")    
print(body_content)
...