Я пытаюсь очистить веб-страницу с таблицей, встроенной в комментарий HTML, который загружается после выполнения некоторого JavaScript.Я использую request_html и render для выполнения JavaScript и получения полной страницы, включая таблицу (которая фактически является второй таблицей на странице), и это хорошо работает.Проблема, с которой я сталкиваюсь, заключается в том, что я пытаюсь включить эту таблицу в Pandas DataFrame.
Я попробовал несколько различных вариантов, чтобы попытаться получить данные в формате.После рендеринга веб-страницы я попытался перебрать таблицу, из которой я могу напечатать html таблицы, а также просто текст таблицы, но когда я пытаюсь перебрать таблицу и вставить данные в Pandas DataFrameэто терпит неудачу.
from requests_html import HTMLSession
url = 'https://www.sports-reference.com/cfb/schools/iowa/2018/gamelog/'
session = HTMLSession()
r = session.get(url)
r.html.render()
table = r.html.find('table#defense')
defensive_game_list = []
for d_stats in table:
d_stats_sum = d_stats.find_all('td')
d_game_sum = [d_stats.text for d_stats in d_stats_sum]
defensive_game_list.append(d_game_sum)
df_defense = pd.DataFrame(deffensive_sum_final)
Когда я запускаю код, после итерации я получаю следующую ошибку:
Traceback (последний вызов был последним): файл "", строка 2, в AttributeError: 'Element'У объекта нет атрибута 'find_all'
Я надеюсь, что для этого он поместит текст таблицы в пустой список и затем поместит этот список в DataFrame.
Любая помощь будет принята с благодарностью.Спасибо!