Получение атрибута ETag с Feedparser - PullRequest
3 голосов
/ 24 июня 2011

Я знаю, что Feedparser поддерживает извлечение заголовка ETag (http://www.feedparser.org/docs/http-etag.html),, но извлекаемый мною канал включает в себя «etag» в качестве атрибута в узле контента для каждого entry элемента:
<content type="application/json" etag="c04bada0055b8a12decd459302b2f777">{"name":"Badiou","parent":false}</content>

Однако, когда я анализирую документ Atom, этот атрибут отбрасывается:
'content': [{'base': u'', 'type': u'application/json', 'value': u'{"name":"Badiou","parent":false}', 'language': None}]

Это ограничение Feedparser, и если да, может ли кто-нибудь предложить способ его получения, или мне просто нужно будет проанализировать документ Atom как XML?

1 Ответ

1 голос
/ 20 февраля 2012

Atom и RSS являются стандартами, и ожидается, что стандарты будут внедрены заранее. Feedparser api позволяет нам анализировать каналы ATOM и RSS, которые являются стандартно совместимыми. Соответственно, ожидается, что ETag будет отправлен как атрибут заголовка, а не как атрибут элемента тела. Вот почему feedparser отбрасывает нестандартный атрибут etag. Это не является ограничением feedparser, так как надлежащие etags могут быть получены, как объяснено в их документации @ http://packages.python.org/feedparser. Так что я думаю, что вы должны проанализировать фид атомов как XML-документ.

...