Веб-утилизация - find_all () возвращает пустой список - PullRequest
0 голосов
/ 10 февраля 2020

Я очищаю веб-сайт New York Times, чтобы получить данные для определенного проекта, но все, что я получаю, это пустой список.

Я попытался использовать html .parser и l xml, но никто не работает. Ниже мой код:

#Step 1: Reading the web page into python
import requests

read_webpage = requests.get("https://www.youtube.com/redirect?v=zXif_9RVadI&event=video_description&q=https%3A%2F%2Fwww.nytimes.com%2Finteractive%2F2017%2F06%2F23%2Fopinion%2Ftrumps-lies.html&redir_token=UvU4IsVzgsy7oj0Ns0XLJx26f0l8MTU4MTM4NDUxM0AxNTgxMjk4MTEz")

from bs4 import BeautifulSoup as bs

soup = bs(read_webpage.content, "lxml")

results = soup.find_all('span', attrs={'class':'short-desc'})

print(len(results))

Output = 0

1 Ответ

0 голосов
/ 10 февраля 2020

Работает отлично, спасибо. Я перезапустил ядро ​​

Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...