Question

Какие у меня варианты, если я хочу создать простой файл XML на python?(библиотека)

XML-файл, который я хочу, выглядит следующим образом:

<root>
 <doc>
     <field1 name="blah">some value1</field1>
     <field2 name="asdfasd">some vlaue2</field2>
 </doc>

</root>

ssokolow · Answer 1 · 31 августа 2010

В наши дни наиболее популярным (и очень простым) вариантом является ElementTree API , который был включен в стандартную библиотеку начиная с Python 2.5.

Доступны следующие варианты::

ElementTree (Базовая реализация ElementTree на чистом Python. Часть стандартной библиотеки с 2.5)
cElementTree (Оптимизированная реализация ElementTree на C. Также предлагается в стандартной библиотеке с2.5)
LXML (на основе libxml2. Предлагает богатый расширенный набор API ElementTree, а также XPath, CSS-селекторы и многое другое)

Вот пример того, как сгенерировать ваш примердокумент с использованием in-stdlib cElementTree:

import xml.etree.cElementTree as ET

root = ET.Element("root")
doc = ET.SubElement(root, "doc")

ET.SubElement(doc, "field1", name="blah").text = "some value1"
ET.SubElement(doc, "field2", name="asdfasd").text = "some vlaue2"

tree = ET.ElementTree(root)
tree.write("filename.xml")

Я проверил его, и он работает, но я предполагаю, что пробел не имеет существенного значения.Если вам нужен отступ "prettyprint", дайте мне знать, и я посмотрю, как это сделать.(Это может быть специфичный для LXML вариант. Я не очень часто использую реализацию stdlib)

Для дальнейшего прочтения вот несколько полезных ссылок:

Документы APIдля реализации в стандартной библиотеке Python
Вводное учебное пособие (с оригинального авторского сайта)
Учебное пособие по LXML .(С примером кода для загрузки лучшего доступного варианта из всех основных реализаций ElementTree)

В качестве заключительного замечания, либо cElementTree, либо LXML должны быть достаточно быстрыми для всех ваших потребностей (оба оптимизированных кода C),но в случае, если вам нужно выжать все до последней черты производительности, тесты на сайте LXML показывают, что:

LXML явно выигрывает для сериализации (генерации) XML
В качестве побочного эффекта от реализации правильного обхода родителя LXML немного медленнее, чем cElementTree для анализа.

rescdsk · Answer 2 · 04 апреля 2011

Библиотека lxml включает в себя очень удобный синтаксис для генерации XML, который называется E-factory . Вот как я приведу пример, который вы привели:

#!/usr/bin/python
import lxml.etree
import lxml.builder    

E = lxml.builder.ElementMaker()
ROOT = E.root
DOC = E.doc
FIELD1 = E.field1
FIELD2 = E.field2

the_doc = ROOT(
        DOC(
            FIELD1('some value1', name='blah'),
            FIELD2('some value2', name='asdfasd'),
            )   
        )   

print lxml.etree.tostring(the_doc, pretty_print=True)

Выход:

<root>
  <doc>
    <field1 name="blah">some value1</field1>
    <field2 name="asdfasd">some value2</field2>
  </doc>
</root>

Также поддерживается добавление к уже созданному узлу, например, после вышесказанного можно сказать

the_doc.append(FIELD2('another value again', name='hithere'))

scls · Answer 3 · 02 мая 2015

Yattag http://www.yattag.org/ или https://github.com/leforestier/yattag предоставляет интересный API для создания такого XML-документа (а также документов HTML).

Используется менеджер контекста иwith ключевое слово.

from yattag import Doc, indent

doc, tag, text = Doc().tagtext()

with tag('root'):
    with tag('doc'):
        with tag('field1', name='blah'):
            text('some value1')
        with tag('field2', name='asdfasd'):
            text('some value2')

result = indent(
    doc.getvalue(),
    indentation = ' '*4,
    newline = '\r\n'
)

print(result)

, поэтому вы получите:

<root>
    <doc>
        <field1 name="blah">some value1</field1>
        <field2 name="asdfasd">some value2</field2>
    </doc>
</root>

whaley · Answer 4 · 31 августа 2010

Для самого простого выбора я бы выбрал минидом: http://docs.python.org/library/xml.dom.minidom.html. Он встроен в стандартную библиотеку python и прост в использовании в простых случаях.

Вот довольно простой учебник: http://www.boddie.org.uk/python/XML_intro.html

bigh_29 · Answer 5 · 02 ноября 2017

Для такой простой XML-структуры вы, возможно, не захотите использовать полноценный XML-модуль.Рассмотрим строковый шаблон для простейших структур или Jinja для чего-то более сложного.Jinja может обрабатывать циклы по списку данных для создания внутреннего XML-списка вашего документа.Это немного сложнее с необработанными шаблонами строк Python

Пример Jinja, см. Мой ответ на аналогичный вопрос .

Вот пример создания вашего xml сстроковые шаблоны.

import string
from xml.sax.saxutils import escape

inner_template = string.Template('    <field${id} name="${name}">${value}</field${id}>')

outer_template = string.Template("""<root>
 <doc>
${document_list}
 </doc>
</root>
 """)

data = [
    (1, 'foo', 'The value for the foo document'),
    (2, 'bar', 'The <value> for the <bar> document'),
]

inner_contents = [inner_template.substitute(id=id, name=name, value=escape(value)) for (id, name, value) in data]
result = outer_template.substitute(document_list='\n'.join(inner_contents))
print result

Вывод:

<root>
 <doc>
    <field1 name="foo">The value for the foo document</field1>
    <field2 name="bar">The &lt;value&gt; for the &lt;bar&gt; document</field2>
 </doc>
</root>

Недостатком шаблонного подхода является то, что вы не получите экранирование < и > бесплатно.Я танцевал вокруг этой проблемы, вытаскивая утилиту из xml.sax

John · Answer 6 · 13 февраля 2019

Теги и значения нужно использовать преселей и в точку, чтобы это работало.Я сделал это прежде, чем найду свой код для показа в качестве примера.

пока что найди больше информации здесь- https://www.w3schools.com/php/

Cloughie · Answer 7 · 18 октября 2018

Я только что закончил написание генератора xml, используя метод шаблонов bigh_29 ... это хороший способ контролировать то, что вы выводите без слишком большого количества объектов, мешающих работе.значение, я использовал два массива, один из которых дал имя тега и положение в выходной XML и другой, который ссылался на файл параметров, имеющий тот же список тегов.Файл параметров, однако, также имеет номер позиции в соответствующем файле ввода (CSV), откуда данные будут взяты.Таким образом, если есть какие-либо изменения в положении данных, поступающих из входного файла, программа не изменится;он динамически определяет положение поля данных из соответствующего тега в файле параметров.

Создание простого XML-файла с использованием Python

Пожалуйста, войдите или зарегистрируйтесь чтобы ответить на этот вопрос.

Ответы [ 7 ]

Пожалуйста, войдите или зарегистрируйтесь что бы добавить комментарий.

Пожалуйста, войдите или зарегистрируйтесь что бы добавить комментарий.

Пожалуйста, войдите или зарегистрируйтесь что бы добавить комментарий.

Пожалуйста, войдите или зарегистрируйтесь что бы добавить комментарий.

Пожалуйста, войдите или зарегистрируйтесь что бы добавить комментарий.

Пожалуйста, войдите или зарегистрируйтесь что бы добавить комментарий.

Пожалуйста, войдите или зарегистрируйтесь что бы добавить комментарий.

Создание простого XML-файла с использованием Python

Пожалуйста, войдите или зарегистрируйтесь чтобы ответить на этот вопрос.

Ответы [ 7 ]

Пожалуйста, войдите или зарегистрируйтесь что бы добавить комментарий.

Пожалуйста, войдите или зарегистрируйтесь что бы добавить комментарий.

Пожалуйста, войдите или зарегистрируйтесь что бы добавить комментарий.

Пожалуйста, войдите или зарегистрируйтесь что бы добавить комментарий.

Пожалуйста, войдите или зарегистрируйтесь что бы добавить комментарий.

Пожалуйста, войдите или зарегистрируйтесь что бы добавить комментарий.

Пожалуйста, войдите или зарегистрируйтесь что бы добавить комментарий.

Нет похожих вопросов