Разобрать XML в файл с массивом - PullRequest
0 голосов
/ 21 февраля 2019

Мне нужно создать файл ниже.Использование python для разбора образца XML:

Пример XML

<fruits>
<tag beginTime="20181125020000" endTime="20181202020000">
<EventId>16778</EventId>
    <item color="red">
        <name>apple</name>
        <count>1</count>
        <subtag>
            <Info name="Eid">396</Info>
            <Info name="New">397</Info>
        </subtag>
    </item>
    <item color="yellow">
        <name>banana</name>
        <count>2</count>
        <subtag>
            <Info name="Eid">500</Info>
            <Info name="New">650</Info>
            <Info name="Col">999</Info>
        </subtag>
    </item>
</tag>  

Желаемый вывод:

20181125020000|20181202020000|16778|red|apple|1|Eid;396;New;397|
20181125020000|20181202020000|16778|yelow|banana|1|Eid;500;New;650;Col;999|

Ответы [ 2 ]

0 голосов
/ 21 февраля 2019

Другой способ сделать это - преобразовать XML в json:

import xmltodict

with open('file.xml') as f:
    d = xmltodict.parse(f.read())['fruits']['tag']

for i in d['item']:
    subtag = []
    for s in i['subtag']['Info']:
        subtag.append('{};{}'.format(s['@name'], s['#text']))
    print('{}|{}|{}|{}|{}|{}|{}|'.format(d['@beginTime'], d['@endTime'], d['EventId'], i['@color'], i['name'], i['count'], ';'.join(subtag)))

Вывод:

20181125020000|20181202020000|16778|red|apple|1|Eid;396;New;397|
20181125020000|20181202020000|16778|yellow|banana|2|Eid;500;New;650;Col;999|
0 голосов
/ 21 февраля 2019

Попробуйте этот код.

import xml.etree.ElementTree as Et

file = Et.parse('some.xml')

tags = file.findall('tag')
for tag in tags:
temp1 = []
beginTime = tag.get('beginTime')
temp1.append(beginTime)
endTime = tag.get('endTime')
temp1.append(endTime)
eventId = tag.find('EventId').text
temp1.append(eventId)
items = tag.findall('item')

for item in items:
    temp2 = []
    color = item.get('color')
    temp2.append(color)
    name = item.find('name').text
    temp2.append(name)
    count = item.find('count').text
    temp2.count(count)
    infos = item.find('subtag').findall('Info')

    temp3 = []
    for info in infos:
        name = info.get('name')
        value = info.text
        temp3.append(name)
        temp3.append(value)
    temp3 = [';'.join(temp3)]
    result = temp1 + temp2 + temp3
    result = '|'.join(result)
    print(result)
...