Просто пытаюсь создать простую программу, чтобы получить последние изменения в Википедии и проанализировать этот XML-файл.
Я застрял в том месте, где findall () не работает.Что я делаю не так?
import urllib2 from lxml import etree as ET result = urllib2.urlopen('http://en.wikipedia.org/w/api.php?action=query&format=xml&list=recentchanges&rcprop=title|ids|sizes|flags|user|timestamp').read() xml=ET.fromstring (result) print xml[0][0][0].attrib # that works! print xml.findall ('api/query/recentchanges/rc') # that don't!
Я подозреваю, что корневой узел - это тематический узел, поэтому он ищет узел с именем "api" внутри корневого узла. Если это так, оба из следующих будут работать:
query/recentchanges/rc /api/query/recentchanges/rc