In [1]: from lxml import etree
У меня есть HTML-документ:
In [2]: root = etree.fromstring(u'''<!DOCTYPE HTML PUBLIC "-//IETF//DTD HTML//EN">\n<HTML></HTML>''', etree.HTMLParser())
Его тип документа анализируется правильно:
In [3]: root.getroottree().docinfo.doctype
Out[3]: u'<!DOCTYPE html PUBLIC "-//IETF//DTD HTML//EN">'
Но при сериализации я теряю его:
In [4]: etree.tostring(root.getroottree(), method='html')
Out[4]: '<html></html>'
Что мне нужно сделать, чтобы сериализовать этот тип документа?
Debian GNU / Linux, Sid.Python 2.6.6.lxml 2.2.8-2.