<li><a href="https://en.wikipedia.org/wiki/yyyyy.html" title="yyyyy">yyyyyy</a></li>
Я пытаюсь вырезать данные и смог сделать это с помощью Beautifulsoup.
Код, который я использую:
for ul in soup.findAll('div'): print(ul.text) for li in ul.findAll('li'): print(li.text) f.write("li "+str(li.text))
Как я могу получить href.Я смотрю вывод как: ггггг; https://en.wikipedia.org/wiki/yyyyy.html
Вы можете попробовать Tag.find():
Tag.find()
f.write("li "+li.find('a')['href'])