lxml findall () проблема - PullRequest
       9

lxml findall () проблема

2 голосов
/ 25 апреля 2011

Просто пытаюсь создать простую программу, чтобы получить последние изменения в Википедии и проанализировать этот XML-файл.

Я застрял в том месте, где findall () не работает.Что я делаю не так?

import urllib2
from lxml import etree as ET

result = urllib2.urlopen('http://en.wikipedia.org/w/api.php?action=query&format=xml&list=recentchanges&rcprop=title|ids|sizes|flags|user|timestamp').read()

xml=ET.fromstring (result)

print xml[0][0][0].attrib # that works!

print xml.findall ('api/query/recentchanges/rc') # that don't!

1 Ответ

3 голосов
/ 25 апреля 2011

Я подозреваю, что корневой узел - это тематический узел, поэтому он ищет узел с именем "api" внутри корневого узла. Если это так, оба из следующих будут работать:

query/recentchanges/rc

/api/query/recentchanges/rc
...