Я не уверен, почему вы объединяете \ a в конце URL, поскольку это перенаправляет на страницу о нас. Кроме того, я не вижу табличных / tr / td-тегов для работы с базовым URL-адресом или информацией о нас. Вместо этого, если вы намеревались циклически проходить по двум (или более) страницам, которые являются пагинацией для базового URL, вы можете сделать это, проверив наличие атрибута rel
со значением next
. И да, вам нужен действительный заголовок User-Agent.
import requests
from bs4 import BeautifulSoup as bs
headers = {
'User-Agent': 'Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/77.0.3865.120 Safari/537.36',
}
page = 1
with requests.Session() as s:
s.headers = headers
while True:
r = s.get(f'https://techadvisorblog.com/page/{page}/')
soup = bs(r.content, 'lxml')
print(soup.select_one('title').text)
if soup.select_one('[rel=next]') is None:
break
page+=1