Вы не предоставляете сообщение об ошибке, поэтому я не уверен, что это единственная ошибка. Но xml.minidom.parse
не принимает строку. Из строки документации для parse
:
Анализ файла в DOM по имени файла или объекту файла.
Вы должны попробовать:
response = urllib2.urlopen(askfor)
doc = parse(response)
, поскольку response
будет вести себя как файловый объект. Или вместо этого вы можете использовать метод parseString
в minidom
(а затем передать the_page
в качестве аргумента).
РЕДАКТИРОВАТЬ: чтобы извлечь URL, вам нужно сделать:
url_nodes = doc.getElementsByTagName('url')
url = url_nodes[0]
print url.childNodes[0].data
Результатом getElementsByTagName
является список всех совпадающих узлов (в данном случае только один). url
- это элемент, как вы заметили, который содержит дочерний узел Text, содержащий необходимые данные.