Извлечение чего-то конкретного из BS4 после запуска find_all - PullRequest
0 голосов
/ 29 июня 2018

Я пытаюсь начать работу с использованием BS4. Я пошел на сайт под названием finviz.com, так как у меня там есть кое-что, что меня заинтересует.

print(soup.find_all('a', class_ = 'screener-link-primary'))

Вот две строки вывода, когда я печатаю выше ^. Как мне извлечь "AGO" и "AGM" из этого? Я попытался вставить строку текста как текст, но она убрала все теги html ... поэтому я вставил ее как изображение

Выходное изображение

1 Ответ

0 голосов
/ 29 июня 2018

Используйте свойство .text, чтобы получить текст между тегами <a> и </a>.

sample_html = '''
<a class="screener-link-primary" href="aych-ref">AGM</a>
<a class="screener-link-primary" href="aych-ref">AGO</a>
'''
from bs4 import BeautifulSoup
soup = BeautifulSoup(sample_html, 'html.parser')
links = soup.find_all('a', class_='screener-link-primary')
for link in links:
    print(link.text)
Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...