Как написать атрибуты пространства имен с помощью LXML? - PullRequest
16 голосов
/ 09 октября 2011

Я использую lxml (2.2.8) для создания и записи некоторого XML (в частности, XGMML). Приложение , которое будет читать его, по-видимому, довольно привередливое и хочет видеть элемент верхнего уровня с:

<graph label="Test" xmlns:dc="http://purl.org/dc/elements/1.1/" xmlns:xlink="h
ttp://www.w3.org/1999/xlink" xmlns:rdf="http://www.w3.org/1999/02/22-rdf-syntax-
ns#" xmlns:cy="http://www.cytoscape.org" xmlns="http://www.cs.rpi.edu/XGMML"  di
rected="1">

Как мне настроить эти xmlns: атрибуты с помощью lxml? Если я попробую очевидное

root.attrib['xmlns:dc']='http://purl.org/dc/elements/1.1/'
root.attrib['xmlns:xlink']='http://www.w3.org/1999/xlink'
root.attrib['xmlns:rdf']='http://www.w3.org/1999/02/22-rdf-syntax-ns#'
root.attrib['xmlns:cy']='http://www.cytoscape.org'
root.attrib['xmlns']='http://www.cs.rpi.edu/XGMML'

lxml бросает ValueError: Invalid attribute name u'xmlns:dc'

В прошлом я использовал довольно много XML и lxml для простых вещей, но мне удалось избежать необходимости что-либо знать о пространствах имен.

Ответы [ 2 ]

23 голосов
/ 09 октября 2011

В отличие от ElementTree или других сериализаторов, которые позволяют это, lxml требует, чтобы вы предварительно настроили эти пространства имен:

NSMAP = {"dc" : 'http://purl.org/dc/elements/1.1',
         "xlink" : 'http://www.w3.org/1999/xlink'}

root = Element("graph", nsmap = NSMAP)

(и так далее, и тому подобное для остальных объявлений)

И затем вы можете использовать пространства имен, используя их соответствующие объявления:

n = SubElement(root, "{http://purl.org/dc/elements/1.1}foo")

Конечно, это раздражает при наборе, поэтому обычно полезно назначать пути коротким именам констант:

DCNS = "http://purl.org/dc/elements/1.1"

А затем используйте эту переменную в объявлениях NSMAP и SubElement:

n = SubElement(root, "{%s}foo" % (DCNS))
5 голосов
/ 09 октября 2011

Использование ElementMaker :

import lxml.etree as ET
import lxml.builder as builder
E = builder.ElementMaker(namespace='http://www.cs.rpi.edu/XGMML',
                         nsmap={None: 'http://www.cs.rpi.edu/XGMML',
                         'dc': 'http://purl.org/dc/elements/1.1/',
                         'xlink': 'http://www.w3.org/1999/xlink',
                         'rdf': 'http://www.w3.org/1999/02/22-rdf-syntax-ns#',
                         'cy': 'http://www.cytoscape.org', })
graph = E.graph(label="Test", directed="1")
print(ET.tostring(graph, pretty_print=True))

выход

<graph xmlns:cy="http://www.cytoscape.org" xmlns:rdf="http://www.w3.org/1999/02/22-rdf-syntax-ns#" xmlns:dc="http://purl.org/dc/elements/1.1/" xmlns:xlink="http://www.w3.org/1999/xlink" xmlns="http://www.cs.rpi.edu/XGMML" directed="1" label="Test"/>
...