Я пытаюсь очистить, но моя командная строка ничего не печатает. Что я делаю неправильно? - PullRequest
2 голосов
/ 25 октября 2019

Я пытаюсь распечатать заголовки. Вот мой код:

`import requests
from bs4 import BeautifulSoup

base_url = 'http://www.nytimes.com'
r = requests.get(base_url)
r_html = r.text
soup = BeautifulSoup(r.text, features="lxml")

for story_heading in soup.find_all(class_="balancedHeadline"):
    if story_heading.a:
        print(story_heading.a.text.replace("\n", " ").strip())
    else:
        print(story_heading.contents[0].strip())`

Моя командная строка не дает мне ответа. Ничего не печатает. Что не так с моим кодом?

Ответы [ 2 ]

1 голос
/ 25 октября 2019

Попробуйте этот код.

import requests
from bs4 import BeautifulSoup

base_url = 'http://www.nytimes.com'
r = requests.get(base_url)
r_html = r.text
soup = BeautifulSoup(r.text)

for story_heading in soup.findAll(class_="css-1m5bs2v esl82me0"):
    print(story_heading.get_text())
1 голос
/ 25 октября 2019

Список soup.find_all(class_="balancedHeadline") возвратов пуст. Кажется, нет никакого класса "BalanceHeadline". Я не проверял схему классов, но вы получите хотя бы некоторые результаты для class_="css-1m5bs2v esl82me0".

...