Парсинг различных форматов даты из feedparser в python? - PullRequest
8 голосов
/ 22 октября 2008

Я пытаюсь получить даты из записей в двух разных каналах RSS через feedparser .

Вот что я делаю:

import feedparser as fp
reddit = fp.parse("http://www.reddit.com/.rss")
cc = fp.parse("http://contentconsumer.com/feed")
print reddit.entries[0].date
print cc.entries[0].date

А вот как они вышли:

2008-10-21T22:23:28.033841+00:00

Wed, 15 Oct 2008 10:06:10 +0000

Я хочу добраться до точки, где я могу легко узнать, что новее.

Я пытался использовать модуль datetime Python и искать в документации feedparser, но не могу обойти эту проблему. Любая помощь будет высоко ценится.

1 Ответ

14 голосов
/ 22 октября 2008

Разбор дат - это проблема с RSS-лентами в дикой природе, и здесь feedparser может помочь.

Если вы используете свойства *_parsed (например, updated_parsed), feedparser выполнит работу и вернет дату Python с 9 кортежами в UTC.

Подробнее см. http://packages.python.org/feedparser/date-parsing.html.

...