Я должен выбрать каждое состояние из https://www.maxpreps.com/search/states_by_sport.aspx?gendersport=boys,football&season=fall, а затем щелкнуть по рейтингу команды, и после этого я должен получить ссылки на href каждой команды в рейтинге.
Я выполнил до командыТеперь я хочу получить ссылки на каждую ранжированную команду со всех страниц в панели разбивки на страницы. Сейчас я получаю ссылки на все команды, доступные только на первой странице, я не знаю, как перейти на следующую страницу. (нижеэто код)
запросы на импорт от bs4 импорт BeautifulSoup с urllib.request импорт urlopen импорт re
site = "https://www.maxpreps.com"
url = запросы.get (" https://www.maxpreps.com/search/states_by_sport.aspx?gendersport=boys,football&season=fall") soup = BeautifulSoup (url.content, "html.parser") states = soup.findAll ('div', {'class': 'states'}) для каждого состояния в состояниях: all_states = each_state.find_all ('a', href = True) для a в all_states: домен = site + a ['href'] #domain состоит из ссылок состояний для r в домене: page_link = domain page_response = запросы.get (page_link) суп = BeautifulSoup (page_response.content, "html.parser") для ссылки в soup.findAll('a', attrs = {'href': re.compile ("Rankings")}): Rankings_link = site + link.get ('href') #print (Rankings_link)
for ert in rankings_link:
team_link = rankings_link
page_response1 = requests.get(team_link)
soup = BeautifulSoup(page_response1.content, "html.parser")
My_table = soup.find('table',{'class':'mx-grid sortable rankings-grid'})
links = My_table.findAll('a')
print(links)
Эверетт , Метуен ,