Как получить данные из Google Reader? - PullRequest
1 голос
/ 31 января 2012

Проблема: я хочу загрузить данные RSS-канала из Google Reader.Из прямой подачи я мог загрузить около 20 записей, но из Google Reader я смог получить 5000 последних сообщений.

Мое решение (не работает):

1.) Аутентифицировать (используя этот пост: Google Reader API Количество непрочитанных сообщений )

2.) http://www.google.com/reader/atom/feed/FEED_URL?r=n&n=NUMBER_OF_ITEMS этот адрес должен возвращать X последних сообщений.Конкретный URL для канала NY Times и для последних 100 сообщений: http://www.google.com/reader/atom/feed/http://feeds.nytimes.com/nyt/rss/HomePage?r=n&n=100

3.) Используйте python и feedparser для получения содержимого

import feedparser

url= "http://www.google.com/reader/atom/feed/http://feeds.nytimes.com/nyt/rss/HomePage?r=n&n=100"

d = feedparser.parse (url)

print d [" feed "] [" title "] #, чтобы получить заголовок канала

Мое сообщение об ошибке после выполнения этого кода:

Трассировка (последний последний вызов):

Файл "---", строка 40, в печати d ["feed "] [" title "]

Файл" C: \ Python27 \ lib \ site-packages \ feedparser.py ", строка 346, в __ getitem__, возвращать dict .__ getitem __ (self, key)

KeyError: 'title'

Можно ли использовать feedparser для анализа содержимого? Или единственный способ - использовать регулярные выражения?

1 Ответ

1 голос
/ 31 января 2012

Похоже, у вас есть нумерация страниц.Посмотрите на документацию для "подсчета" и "продолжения"

http://code.google.com/p/pyrfeed/wiki/GoogleReaderAPI

...