Question

Я пытаюсь начать работу с использованием BS4. Я пошел на сайт под названием finviz.com, так как у меня там есть кое-что, что меня заинтересует.

print(soup.find_all('a', class_ = 'screener-link-primary'))

Вот две строки вывода, когда я печатаю выше ^. Как мне извлечь "AGO" и "AGM" из этого? Я попытался вставить строку текста как текст, но она убрала все теги html ... поэтому я вставил ее как изображение

Выходное изображение

BenG-TW · Answer 1 · 29 июня 2018

Используйте свойство .text, чтобы получить текст между тегами <a> и </a>.

sample_html = '''
<a class="screener-link-primary" href="aych-ref">AGM</a>
<a class="screener-link-primary" href="aych-ref">AGO</a>
'''
from bs4 import BeautifulSoup
soup = BeautifulSoup(sample_html, 'html.parser')
links = soup.find_all('a', class_='screener-link-primary')
for link in links:
    print(link.text)

Извлечение чего-то конкретного из BS4 после запуска find_all

Пожалуйста, войдите или зарегистрируйтесь чтобы ответить на этот вопрос.

1 Ответ

Пожалуйста, войдите или зарегистрируйтесь что бы добавить комментарий.

Извлечение чего-то конкретного из BS4 после запуска find_all

Пожалуйста, войдите или зарегистрируйтесь чтобы ответить на этот вопрос.

1 Ответ

Пожалуйста, войдите или зарегистрируйтесь что бы добавить комментарий.

Нет похожих вопросов