Я просматриваю журналы / статистику игр (бейсболистов) каждый день. На странице игрока есть разные таблицы для каждого месяца, но все они имеют одинаковые идентификаторы / метки в коде HTML. Текущий код ниже находит все таблицы, а затем циклически просматривает их, чтобы найти строку с сегодняшней датой, чтобы захватить одну новую строку данных. Как можно изменить его, чтобы перейти к последней строке таблицы на странице и прочитать ее в todaystats
, когда дата равна date_today
? Или, по крайней мере, перейти к последней таблице на странице, прежде чем она начнет циклически перемещаться по строкам, чтобы найти таблицу с сегодняшней датой?
tables = urllib.request.urlopen(URL).read()
soup = BeautifulSoup(tables, 'html.parser')
tables = soup.find_all('table')
dfpitcher = pd.read_html(str(tables), flavor="bs4")
for i, df in enumerate(dfpitcher):
df.columns = ['Date', 'Opponent', 'ERA', 'Result', 'PA', 'IP', 'H', 'HR', 'BB', 'HBP', 'K', 'R', 'ER', 'OAVG']
todaystats = df.loc[df['Date'] == date_today]