Question

Я пытаюсь получить ссылку на сайт. Когда я вставляю страницу в Chrome, я вижу это:

<div>
  <strong>Services</strong>
  <p class="pdflink"><a href="http://shopalpha.com/services/&amp;fileId=12345&amp;_ga=1.255686972.2435297996.2694961543-2467379995.2693735225" target="_blank">Services week 11 pdf</a></p>
</div>

Но когда я пытаюсь получить этот URL-адрес в моем скрипте с использованием Beautifulsoup, я не получаю весь URL-адрес, только это:

>>> print soup.find('p', attrs={'class': 'pdflink'}).find('a', href=True)['href']
http://shopalphalc.com/services/&amp;fileId=12345

Я не знаю, был ли URL-адрес каким-либо образом изменен при загрузке страницы, но есть ли способ получить полный URL-адрес с помощью BeautifulSoup?

BeautifulSoup получить HREF

Пожалуйста, войдите или зарегистрируйтесь чтобы ответить на этот вопрос.

Ответы [ 0 ]

BeautifulSoup получить HREF

Пожалуйста, войдите или зарегистрируйтесь чтобы ответить на этот вопрос.

Ответы [ 0 ]

Нет похожих вопросов