Я бы хотел написать эту страницу.
Итак, я начал с этого сценария:
import requests
from bs4 import BeautifulSoup
import numpy as np
import pandas as pd
import matplotlib.pyplot as plt
links = {"Copa do Brasil": "http://www.oddsportal.com/soccer/brazil/copa-do-
brasil/results/"}
headers = {'User-Agent': 'Mozilla/5.0 (Macintosh; Intel Mac OS X 10_11_6)
AppleWebKit/537.36 (KHTML, like Gecko) Chrome/61.0.3163.100 Safari/537.36'}
data = []
for club, link in links.items():
response = requests.get(link, headers = headers)
#print(response.status_code) #200 is OK
soup = BeautifulSoup(response.text, 'lxml')
#print(soup.prettify()) #to check if soup downloads correctly.
table = soup.find_all('div', attrs ={'id', 'tournamentTable'})
print(table)
Проблема заключается в следующих строках при проверке HTML-кода:
<div id="tournamentTable" style = "display: block;">
<table class =" table-main" id="tournamentTable"> </table> ==$0
Мне интересно, что мне делать, чтобы получить таблицу всех матчей. Я застрял в том факте, что класс, идентификатор и стиль используются вместе.