Я пытаюсь использовать Python и Selenium для очистки динамически загружаемых данных с веб-сайта. Проблема в том, что только около половины данных сообщается как настоящие, когда на самом деле все это должно быть там. Даже после использования пауз перед распечаткой всего содержимого страницы или простого поиска элемента с помощью поиска по классам, похоже, решения не существует. URL сайта: https://www.sportsbookreview.com/betting-odds/nfl-football/consensus/?date=20180909. Как видите, есть 13 основных разделов, однако я могу получить данные только из первых четырех игр. Чтобы лучше показать проблему, я приложу код для печати внутреннего HTML-кода для всей страницы, чтобы показать расхождения между загруженными и незагруженными данными.
from selenium import webdriver
import requests
url = "https://www.sportsbookreview.com/betting-odds/nfl-football/consensus/?date=20180909"
driver = webdriver.Chrome()
driver.get(url)
print(driver.execute_script("return document.documentElement.innerText;"))
EDIT :
Проблема не в времени ожидания, потому что я запускаю его построчно и полностью жду, пока он загрузится. Кажется, проблема сводится к тому, что селен не захватывает весь загруженный JS текст на странице, как видно из вывода консоли в ответе ниже.