Как сделать XML с Python 2.7 Модуль ElementTree с Unicode - PullRequest
1 голос
/ 06 октября 2019

У меня есть код, который вызывает фатальное исключение при вводе Unicode. Я использую ElementTree для создания XML-документа и tostring () для его печати. Я попытался передать объекты Unicode и кодировать их как строки UTF-8, и это не имеет значения. Я не могу понять, делаю ли я что-то неправильно или в модуле есть ошибка.

Вот небольшой пример для воспроизведения.

#!/usr/bin/python

from __future__ import unicode_literals, print_function
from xml.etree.ElementTree import Element, SubElement, tostring
import xml.etree.ElementTree as ET
import time

def main():
    xml = Element('build_summary')
    mpversion = SubElement(xml, 'magpy_version')
    mpversion.text = '1.2.3.4'
    version = SubElement(xml, 'version')
    version.text = '11.22.33.44'
    date = SubElement(xml, 'date')
    date.text = time.strftime("%a %b %-d %Y", time.localtime())
    args = SubElement(xml, 'args')
    args.text = 'build args'
    issues = SubElement(xml, 'issues')
    # Add the repos and the changes in them
    changelog = 'this is the changelog \u2615'
    #changelog = 'this is the changelog'
    print("adding changelog:", changelog)
    repository = SubElement(issues, 'repo')
    reponame = SubElement(repository, 'reponame')
    reponame.text = 'repo name'
    repoissues = SubElement(repository, 'repoissues')
    #repoissues.text = changelog.encode('UTF-8', 'replace')
    repoissues.text = changelog

    # Generate a string, reparse it, and pretty-print it.
    #ET.dump(xml)
    #xml.write('myoutput.xml')
    rough = tostring(xml, encoding='UTF-8', method='xml')
    #rough = tostring(xml)
    print(rough)

if __name__ == '__main__':
    main()

Это даетследующее:

msoulier@anton:~$ python treetest.py
adding changelog: this is the changelog ☕
Traceback (most recent call last):
File "treetest.py", line 38, in <module>
    main()
File "treetest.py", line 33, in main
    rough = tostring(xml, encoding='UTF-8', method='xml')
File "/usr/local/Cellar/python@2/2.7.16/Frameworks/Python.framework/Versions/2.7/lib/python2.7/xml/etree/ElementTree.py", line 1127, in tostring
    return "".join(data)
UnicodeDecodeError: 'ascii' codec can't decode byte 0xe2 in position 22: ordinal not in range(128)

Итак, что я здесь не так делаю? Как ни странно, ElementTree.dump работает нормально, но в документах говорится, что не следует использовать его для устранения ошибок.

...