Модуль импорта веб-страниц вместо использования «статического» HTML, как мне получить доступ к этим модулям с помощью BeautifulSoup - PullRequest
1 голос
/ 28 апреля 2019

Веб-сайт, который я использую для проекта в моей школе, не состоит из «статического» html, он использует функцию для импорта модуля, который содержит html-код, который мне нужен для очистки, когда я делаю запрос на веб-сайтиспользуя BeautifulSoup, я получаю HTML-файл, содержащий скрипт для функции, которая импортирует HTML-код (у меня это прямо здесь).Любые идеи о том, как я могу получить доступ к фактическому коду HTML?

<script>
    webpack.import('modules/leaderboard/leaderboard').then(function (module) {
        new module.LeaderBoard('#id-606f76f', {});
    });
</script>

1 Ответ

1 голос
/ 28 апреля 2019

Все данные получены из XHR. Вы можете получить это как

import requests

url = 'https://gripapi-static-pd.usopen.com/gripapi/leaderboard.json'
response = requests.get(url).json()

Для печати конкретных данных, например, "to par" значение для первого игрока:

print(response['standings'][0]['toPar']['displayValue'])

"Round 1" значение для второго игрока:

print(response['standings'][1]['roundScores'][0]['score']['value'])

и т.д ...

Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...