После проверки кода на repl.it и самостоятельного посещения веб-страницы я могу подтвердить, что вы вводите правильный HTML-код страницы. Переменная page
содержит таблицы данных, а также их информацию ... а также рекламные объявления страницы, контактную информацию, кнопки и ссылки в социальных сетях, сценарии обнаружения рекламного блока и все остальное на веб-странице. Ваша проблема не в том, что вы получаете не ту страницу, а в том, что вы получаете всю страницу, а не только данные.
Вы хотите выбрать именно те биты, которые вас интересуют - возможно, выбрав таблицу и ее дочерние элементы? HTML-идентификатор таблицы - contracts
- это должно быть хорошее место для начала.
(Попробуйте перейти на страницу в браузере, щелкнуть правой кнопкой мыши в любом месте страницы и щелкнуть «просмотреть исходный код страницы» - вот что привлекает ваша программа. Веб-страница гораздо больше, чем думает большинство людей)!)
В качестве предупреждения, однако, у Sports Reference есть политика использования данных , которая запрещает использование веб-сканеров / пауков на их сайте. Я бы порекомендовал проверить (и использовать) один из бесплатных сайтов, на которые они ссылаются;в противном случае вы рискуете быть забаненным по IP.