Проблемы с запросами и BeautifulSoup - PullRequest
0 голосов
/ 04 апреля 2020

Я пытаюсь прочитать новостную веб-страницу, чтобы узнать названия их историй. Я пытаюсь поместить их в список, но получаю пустой список. Может кто-нибудь указать, пожалуйста, правильное направление здесь? Что мне не хватает? Пожалуйста, смотрите код ниже. Спасибо.

import requests
from bs4 import BeautifulSoup

url = 'https://nypost.com/'
ttl_lst = []

soup = BeautifulSoup(requests.get(url).text, "lxml")

title = soup.findAll('h2', {'class': 'story-heading'})

for row in title:
     ttl_lst.append(row.text)

print (ttl_lst)

1 Ответ

0 голосов
/ 04 апреля 2020

модуль запросов возвращает только первый отправленный им файл html. Такие сайты, как nypost, используют ajax запросы для получения своих статей. Для этого вам нужно будет использовать что-то вроде селена, что позволяет ajax запросов после загрузки страницы.

Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...