Я использую этот канал http://feeds.bbci.co.uk/news/rss.xml и хочу получить все медиафайлы: записи миниатюр. То есть все изображения
import feedparser d = feedparser.parse('http://feeds.bbci.co.uk/news/rss.xml') e = d['entries'][0] print e.media_thumbnail ## this returns ''
У записи есть это в rss:
media:thumbnail width="66" height="49" url="http://news.bbcimg.co.uk/media/images/50560000/jpg/_50560468_50557389.jpg" media:thumbnail width="144" height="81" url="http://news.bbcimg.co.uk/media/images/50581000/jpg/_50581208_010904244-1.jpg"
Итак, информация есть, но как мне ее получить?
(Я использую последнюю версию feedparser feedparser. версия -> '4.2-pre-294-svn')
Используя последний SVN r354, я получил это:
>>> e = d['entries'][0] >>> print e["media_thumbnail"][0]["url"] http://news.bbcimg.co.uk/media/images/50560000/jpg/_50560468_50557389.jpg
Это работает так же хорошо, особенно если вы хотите изображение для каждой статьи в ленте:
d = feedparser.parse('http://feeds.bbci.co.uk/news/rss.xml') for entry in d.entries: print(entry.media_thumbnail)