Как получить сырой XML обратно из lxml? - PullRequest
7 голосов
/ 24 октября 2010

Я использую следующий код для поиска div:

parser = etree.HTMLParser()
tree = etree.parse(StringIO(page), parser)

div = tree.xpath("//div[@class='content']")[0]

Моя единственная проблема в том, что после этого я не хочу полагаться на lxml для извлечения содержимого указанного div: я просто хочу вернуть необработанный XML, который содержит div. Это выполнимо или я должен полностью отказаться от этого метода?

Ответы [ 2 ]

11 голосов
/ 24 октября 2010

Я думаю, что вы ищете:

etree.tostring(div)
2 голосов
/ 24 октября 2010

Вы пробовали tostring?

raw_xml = etree.tostring(div)
...