Я пытаюсь использовать lxml.etree.parse
и tree.xpath
в django для анализа некоторого контента из внешнего RSS-канала. Но по какой-то причине я не могу получить никаких результатов. Ранее я мог использовать приведенный ниже метод с успехом на других XML-файлах, но, похоже, у меня возникли сложности с этим.
Вот как выглядит XML-файл, который я пытаюсь очистить:
<feed xmlns="http://www.w3.org/2005/Atom">
<title>Open Library : Author Name</title>
<link href="http://www.somedomain.org/people/atom/author_name" rel="self"/>
<updated>2012-03-20T16:41:00Z</updated>
<author>
<name>somedomain.org</name>
</author>
<id>tag:somedomain.org,2007:/person_feed/123456</id>
<entry>
<link href="http://www.somedomain.org/roll_call/show/1234" rel="alternate"/>
<id>
tag:somedomain.org,2012-03-20:/roll_call_vote/1234
</id>
<updated>2012-03-20T16:41:00Z</updated>
<title>Once upon a time</title>
<content type="html">
This os a book full of words
</content>
</entry>
</feed>
Вот как выглядит мой взгляд на django:
def openauthors(request):
tree = lxml.etree.parse("http://www.somedomain.org/people/atom/author_name")
listings = tree.xpath("//author")
listings_info = []
for listing in listings:
this_value = {
"name":listing.findtext("name"),
}
listings_info.append(this_value)
json_listings = '{"listings":' + simplejson.dumps(listings_info) + '}'
if("callback" in request.GET.keys()):
callback = request.GET["callback"]
else:
callback = None
if(callback):
response = HttpResponse("%s(%s)" % (
callback,
simplejson.dumps(listings_info)
), mimetype="application/json"
)
else:
response = HttpResponse(json_listings, mimetype="application/json")
return response
Я также пробовал некоторые из следующих путей в надежде, что они могут помочь, но безуспешно.
listings = tree.xpath("feed/author")
listings = tree.xpath("/feed/author")
listings = tree.xpath("/author")
listings = tree.xpath("author")
Буду признателен за любую помощь в правильном направлении.