Возможно, вы можете использовать
from bs4 import BeautifulSoup
soup = BeautifulSoup(html_string, 'html.parser')
soup.find("div", class_="r").a['href']
, поскольку существует только один <div>
класса "r"
и где html_string
- это источник HTML в качестве строки Python.
find()
используется с параметром class_
, чтобы найти <div>
класса "r"
.Затем осуществляется доступ к его дочернему атрибуту <a>
href
.
Таким образом, результат будет
https://www.snopes.com/fact-check/canada-marijuana-federal-debt/