BeautifulSoup получить HREF - PullRequest
       0

BeautifulSoup получить HREF

0 голосов
/ 11 марта 2020

Я пытаюсь получить ссылку на сайт. Когда я вставляю страницу в Chrome, я вижу это:

<div>
  <strong>Services</strong>
  <p class="pdflink"><a href="http://shopalpha.com/services/&amp;fileId=12345&amp;_ga=1.255686972.2435297996.2694961543-2467379995.2693735225" target="_blank">Services week 11 pdf</a></p>
</div>

Но когда я пытаюсь получить этот URL-адрес в моем скрипте с использованием Beautifulsoup, я не получаю весь URL-адрес, только это:

>>> print soup.find('p', attrs={'class': 'pdflink'}).find('a', href=True)['href']
http://shopalphalc.com/services/&amp;fileId=12345

Я не знаю, был ли URL-адрес каким-либо образом изменен при загрузке страницы, но есть ли способ получить полный URL-адрес с помощью BeautifulSoup?

Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...