Проблема с BeautifulSoup и печать строки из функции findAll - PullRequest
0 голосов
/ 08 октября 2011

Я пытаюсь получить заголовки тем из / r / Askreddit. Код ниже возвращает None вместо заголовка темы.

from BeautifulSoup import BeautifulSoup
import urllib2, json

site='http://www.reddit.com/r/AskReddit/'

soup=BeautifulSoup(urllib2.urlopen(site))

questions=soup.findAll('p',{"class":"title"})


for i in questions:
        print i.string
        break

1 Ответ

1 голос
/ 08 октября 2011

Заголовок содержится в атрибуте string тега a, а не в теге p.Кроме того, обратите внимание на пробел после title:

questions=soup.findAll('a',{"class":"title "})

При просмотре этого фрагмента HTML было обнаружено выше:

<p class="title"><a class="title " href="http://www.reddit.com/r/AskReddit/comments/l5157/whats_the_best_face_you_can_pull_before_and_after/">What's the best face you can pull? Before and after please.</a> <span class="domain">(<a href="http://www.reddit.com/r/AskReddit/">self.AskReddit</a>)</span></p>
Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...