Когда я пытаюсь получить ссылку на веб-странице, bs4
не перехватывает всю ссылку, она останавливается до **?ref**....
.
Я объясню вопрос через код:
imdb_link = "https://www.imdb.com/chart/top?ref_=nv_mv_250"
site = requests.get(imdb_link)
soup = BeautifulSoup(site.text,'lxml')
for items in soup.find("table",class_="chart").find_all(class_="titleColumn"):
link = items.find("a").get('href')
print(link)
Вывод:
/title/tt0111161/
/title/tt0068646/
/title/tt0071562/
/title/tt0468569/
/title/tt0050083/
/title/tt0108052/
/title/tt0167260/
...and so on..
Но это неправильно, как вы можете видеть, увидев веб-страницу, потому что это может быть:
/title/tt0111161/?ref_=adv_li_tt
/title/tt0068646/?ref_=adv_li_tt
...and so on...
Как я могуполучить всю ссылку?Я имею в виду ?ref_=adv_li_tt
тоже?
Я использую Python 3.7.4