Я пытаюсь почистить несколько вещей из этой страницы фэнтезийного баскетбола .Для этого я использую BeautifulSoup в Python 3.5+.
source_code = requests.get('http://fantasy.espn.com/basketball/league/standings?leagueId=633975')
plain_text = source_code.text
soup = BeautifulSoup(plain_text, 'lxml')
Для начала я бы хотел вычеркнуть названия для 9 категорий в список Python.Мой список должен выглядеть так: categories = [FG%, FT%, 3PM, REB, AST, STL, BLK, TO, PTS]
.
. Я надеялся сделать что-то вроде следующего:
tableSubHead = soup.find_all('tr', class_='Table2__header-row')
tableSubHead = tableSubHead[0]
listCats = tableSubHead.find_all('th')
categories = []
for cat in listCats:
if 'title' in cat.attrs:
categories.append(cat.string)
Однако soup.find_all('tr', class_='Table2__header-row')
возвращает пустой список вместо таблицыэлемент строки я хочу.Я подозреваю, что это потому, что при просмотре исходного кода страницы он полностью отличается от Inspect Element в Chrome Dev Tools.Я понимаю, что это потому, что Javascript изменяет элементы на странице динамически, но я не уверен, каким будет решение.