Расшифруйте веб-страницу, используя запрос и пакет BeautifulSoup - PullRequest
0 голосов
/ 09 января 2019

Я пробую практический вопрос по питону. Вопрос заключается в том, чтобы использовать BeautifulSoup и запрашивать пакеты Python для распечатки списка всех заголовков статей на домашней странице New York Times. Ниже мое решение, но оно не дает никакого вывода. Я использую Jupyter Notebook, и когда я запускаю приведенный ниже код, он ничего не делает. Мое ядро ​​также работает нормально, что означает, что у меня есть проблема с моим кодом.

import requests
from bs4 import BeautifulSoup
from urllib.request import urlopen

base_url= 'https://www.nytimes.com/'
r=requests.get(base_url)
soup=BeautifulSoup(urlopen(base_url))

get_titles=soup.find_all(class_="css-1vctqli esl82me2" )

print()
for title in get_titles:
    print(title.text)

1 Ответ

0 голосов
/ 09 января 2019

Где вы взяли этот тег класса? Это не правильный.

Вам необходимо заменить css-1vctqli esl82me2 на css-1j836f9 esl82me3

import requests
from bs4 import BeautifulSoup
from urllib.request import urlopen

base_url = 'https://www.nytimes.com/'
r = requests.get(base_url)
soup = BeautifulSoup(urlopen(base_url))

get_titles = soup.find_all(class_ = "css-1j836f9 esl82me3")

print()
for title in get_titles:
    print(title.text)

И вывод:

enter image description here

Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...