Все, что мне нужно, находится на этой веб-странице: https://www.basketball -reference.com / команды / BOS / 2019.html
Я хотел бы написать что-то, что проходит через именав таблице реестра, затем ищет другие конкретные таблицы на странице (итоги, например) для этого имени игрока, добавляя новые данные в конец строки для этого имени игрока.
Вот что у меня естьдо сих пор, только код, чтобы получить информацию списка .. любое направление или советы будут оценены.
from selenium import webdriver
from selenium.webdriver.common.keys import Keys
from bs4 import BeautifulSoup
from datetime import date, datetime, timedelta
from pandas import DataFrame
import csv
import calendar
import pandas as pd
import os
season = str(date.today().year )
month = calendar.month_name[date.today().month].lower()
teamUrl = "https://basketball-reference.com/teams/"
teamRoster = {'BOS': teamUrl + 'BOS/' + season +'.html'}
driver = webdriver.Chrome()
for url in teamRoster.values():
driver.get(url)
soup = BeautifulSoup(driver.page_source, 'lxml')
#teamName = soup.find(class_="teams*").find_all('span')[1]
for i in soup.find_all('table', id='roster'):
for row1 in i.select('tr')[1:]:
listA = ([td.text for td in row1.select("td")])
print(listA)