Красивый суп не дает результатов - PullRequest
0 голосов
/ 11 марта 2020

Я пытаюсь проанализировать страницу с BS в python.

Вот мой код:

years = range(2010,2021)

urls = []

for year in years:
    yr = str(year)
    url = 'https://www.spotrac.com/nba/contracts/breakdown/'+yr+'/'
    webpage = requests.get(url)
    content = webpage.content
    soup = BeautifulSoup(re.sub("<!--|-->","", content.decode('utf-8')),'lxml')
    a = soup.find('table',{'class':'datatable'})
    urls.append(a)

Я не получаю результатов. Я дважды и трижды проверил класс таблицы в исходной странице. Я полагаю (хотя я думаю, что это - то, где ошибка) - что я правильно закодировал переменную супа, чтобы учесть закомментированный раздел источника страницы.

1 Ответ

1 голос
/ 11 марта 2020

str(range(2010,2021)) даст строку 'range(2010, 2021)'. И затем вы перебираете каждый символ этой строки. Итак, первое значение года - r и т. Д.

Кроме того, для сайта требуется премиум-подписка, и вам необходимо войти в систему, чтобы увидеть данные

`

Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...