Я очищаю веб-сайт New York Times, чтобы получить данные для определенного проекта, но все, что я получаю, это пустой список.
Я попытался использовать html .parser и l xml, но никто не работает. Ниже мой код:
#Step 1: Reading the web page into python import requests read_webpage = requests.get("https://www.youtube.com/redirect?v=zXif_9RVadI&event=video_description&q=https%3A%2F%2Fwww.nytimes.com%2Finteractive%2F2017%2F06%2F23%2Fopinion%2Ftrumps-lies.html&redir_token=UvU4IsVzgsy7oj0Ns0XLJx26f0l8MTU4MTM4NDUxM0AxNTgxMjk4MTEz") from bs4 import BeautifulSoup as bs soup = bs(read_webpage.content, "lxml") results = soup.find_all('span', attrs={'class':'short-desc'}) print(len(results)) Output = 0
Работает отлично, спасибо. Я перезапустил ядро