Я пытаюсь подобрать URL репозитория Git ниже, но у меня возникают реальные проблемы с доступом к нему из Python.
soup = BeautifulSoup(html_string,"lxml") <span class="glyphicons glyphicons-embed-close details-list-item-icon" title="Source Code"></span> <a href="*https://github.com/UnitedBitcoin*" target="_blank" rel="noopener">Source Code</a>
https://coinmarketcap.com/currencies/united-bitcoin/historical-data/?start=20080428&end=20181211
Я получаю огромный длинный список URL-адресов, когда я ищу ссылку на веб-сайт, исходный код и техническую документацию.
На данных, которые вы предоставили, у меня работает следующее:
url = soup.find('a')['href']
А если вам не нужны звездочки,
url = soup.find('a')['href'].strip('*')