То, что я пытаюсь сделать, просто, перейдите на https://www.reddit.com/new/, и извлеките только заголовок первых 3 постов. Я пытался извлечь название только первого, прежде чем перейти к следующим 2, но я продолжаю сталкиваться с проблемами. Буду признателен за любую помощь, которую я мог получить.
import urllib
from bs4 import BeautifulSoup
import requests
quote_page = 'https://www.reddit.com/r/new/'
page = urllib.urlopen(quote_page)
soup = BeautifulSoup(requests.get(quote_page).text, 'html.parser')
title_box = soup.find('div', {'class':'top-matter'})
title = title_box.text.strip()
print(title)
Ошибка вывода:
Traceback (most recent call last):
File "/home/ad044/Desktop/sidebar stuff/123.py", line 13, in <module>
title = title_box.text.strip()
AttributeError: 'NoneType' object has no attribute 'text'
[Finished in 1.8s with exit code 1]
[shell_cmd: python -u "/home/ad044/Desktop/sidebar stuff/123.py"]
[dir: /home/ad044/Desktop/sidebar stuff]
[path: /usr/local/sbin:/usr/local/bin:/usr/sbin:/usr/bin:/sbin:/bin:/usr/games:/usr/local/games:/snap/bin]