Проблема: я хочу загрузить данные RSS-канала из Google Reader.Из прямой подачи я мог загрузить около 20 записей, но из Google Reader я смог получить 5000 последних сообщений.
Мое решение (не работает):
1.) Аутентифицировать (используя этот пост: Google Reader API Количество непрочитанных сообщений )
2.) http://www.google.com/reader/atom/feed/FEED_URL?r=n&n=NUMBER_OF_ITEMS этот адрес должен возвращать X последних сообщений.Конкретный URL для канала NY Times и для последних 100 сообщений: http://www.google.com/reader/atom/feed/http://feeds.nytimes.com/nyt/rss/HomePage?r=n&n=100
3.) Используйте python и feedparser для получения содержимого
import feedparser url= "http://www.google.com/reader/atom/feed/http://feeds.nytimes.com/nyt/rss/HomePage?r=n&n=100" d = feedparser.parse (url) print d [" feed "] [" title "] #, чтобы получить заголовок канала
import feedparser
url= "http://www.google.com/reader/atom/feed/http://feeds.nytimes.com/nyt/rss/HomePage?r=n&n=100"
d = feedparser.parse (url)
print d [" feed "] [" title "] #, чтобы получить заголовок канала
Мое сообщение об ошибке после выполнения этого кода:
Трассировка (последний последний вызов): Файл "---", строка 40, в печати d ["feed "] [" title "] Файл" C: \ Python27 \ lib \ site-packages \ feedparser.py ", строка 346, в __ getitem__, возвращать dict .__ getitem __ (self, key) KeyError: 'title'
Трассировка (последний последний вызов):
Файл "---", строка 40, в печати d ["feed "] [" title "]
Файл" C: \ Python27 \ lib \ site-packages \ feedparser.py ", строка 346, в __ getitem__, возвращать dict .__ getitem __ (self, key)
KeyError: 'title'
Можно ли использовать feedparser для анализа содержимого? Или единственный способ - использовать регулярные выражения?
Похоже, у вас есть нумерация страниц.Посмотрите на документацию для "подсчета" и "продолжения"
http://code.google.com/p/pyrfeed/wiki/GoogleReaderAPI