Я пытаюсь проанализировать HTML-страницу, используя BeautifulSoup
с текстовыми файлами, заканчивающимися расширением .txt
.Я хочу проанализировать HTML и извлечь строку, которая заканчивается на .txt
.
Все такие строки находятся внутри тега <a href>
, и вот несколько примеров:
<a href = "foo.txt">
<a href = "bar.txt">
Как мне получить foo.txt
и bar.txt
.
Я сделал это:
>>> links = soup.findAll('a')
Но я не могу найти, как извлечь полную строку ... Есть предложения?