findall () возвращает пустой список при указании класса
Указание тегов работает нормально
import urllib2
from bs4 import BeautifulSoup
url = "https://www.reddit.com/r/Showerthoughts/top/?sort=top&t=week"
hdr = { 'User-Agent' : 'tempro' }
req = urllib2.Request(url, headers=hdr)
htmlpage = urllib2.urlopen(req).read()
BeautifulSoupFormat = BeautifulSoup(htmlpage,'lxml')
name_box = BeautifulSoupFormat.findAll("a",{'class':'title'})
for data in name_box:
print(data.text)
Я пытаюсь получить только текст поста. Текущий код ничего не печатает. Если я удаляю {'class': 'title'}, он печатает текст поста, а также имя пользователя и комментарии к посту, которые мне не нужны.
Я использую python2 с последними версиями BeautifulSoup и urllib2