Проблемы без использования Beautiful Soup - PullRequest
0 голосов
/ 10 декабря 2018

Я пытаюсь подобрать URL репозитория Git ниже, но у меня возникают реальные проблемы с доступом к нему из Python.

    soup = BeautifulSoup(html_string,"lxml")


    <span class="glyphicons glyphicons-embed-close details-list-item-icon" 
    title="Source Code"></span>
    <a href="*https://github.com/UnitedBitcoin*" target="_blank" 
    rel="noopener">Source Code</a>

https://coinmarketcap.com/currencies/united-bitcoin/historical-data/?start=20080428&end=20181211 enter image description here

Я получаю огромный длинный список URL-адресов, когда я ищу ссылку на веб-сайт, исходный код и техническую документацию.

1 Ответ

0 голосов
/ 10 декабря 2018

На данных, которые вы предоставили, у меня работает следующее:

url = soup.find('a')['href']

А если вам не нужны звездочки,

url = soup.find('a')['href'].strip('*')
Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...