Как мне конвертировать XML в CSV с отсутствующим значением в файле XML? - PullRequest
0 голосов
/ 04 июля 2019

У меня есть простые данные XML, как показано ниже,

<LocationList>
  <Location dateTime="2018-11-17T00:11:01+09:00" x="2711.208" y="566.3292" z="0" motion="Walk" isMoving="True" stepCount="1" groupAreaId="1" commit="True" />
  <Location dateTime="2018-11-17T00:11:02+09:00" x="2640.506" y="518.7352" z="0" motion="Walk" isMoving="True" stepCount="1" groupAreaId="1" commit="True" />
  <Location dateTime="2018-11-17T00:11:03+09:00" x="2640.506" y="518.7352" z="0" motion="Stop" isMoving="False" stepCount="0" groupAreaId="1" />
  <Location dateTime="2018-11-17T00:52:31+09:00" x="2516.404" y="574.0547" z="0" motion="Walk" isMoving="True" stepCount="1" groupAreaId="1" />

, и я попытался это проанализировать XML в файл CSV,

import xml.etree.ElementTree as et
import csv

tree = et.parse('./1_2018-11-17.xml')
nodes = tree.getroot()
with open('testxml1.csv', 'w') as ff:
    cols = ['dateTime','x','y','z','motion','isMoving','stepCount',
            'groupAreaId','commit']
    nodewriter = csv.writer(ff)
    nodewriter.writerow(cols)
    for node in nodes:
        values = [ node.attrib[kk] for kk in cols]
        nodewriter.writerow(values)

Однако, поскольку не все строки XMLимеет значение 'stepCount', 'groupAreaId', 'commit', код не будет работать, пока я не удалю эти переменные.

Как мне получить все переменные, показанные в файле csv, включая строки с пустым значением в переменных?

Ответы [ 2 ]

2 голосов
/ 04 июля 2019

Если вы используете метод .get () для чтения атрибута узла, можно добавить значение по умолчанию, например, пустую строку.Так что в вашем случае это будет так:

for node in nodes:
        values = [ node.attrib.get(kk, '') for kk in cols]
        nodewriter.writerow(values)
1 голос
/ 04 июля 2019

Вы можете использовать оператор if-else в понимании списка, чтобы проверить, существует ли атрибут.

import xml.etree.ElementTree as et
import csv

tree = et.parse('./1_2018-11-17.xml')
nodes = tree.getroot()
with open('testxml1.csv', 'w') as ff:
    cols = ['dateTime', 'x', 'y', 'z', 'motion', 'isMoving', 'stepCount', 'groupAreaId', 'commit']
    nodewriter = csv.writer(ff)
    nodewriter.writerow(cols)
    for node in nodes:
        # if kk is not an attribute, set the value to None
        values = [node.attrib[kk] if kk in node.attrib else None for kk in cols]
        # Replace commit value with false if it does not exist
        if values[-1] is None:
            values[-1] = False
        nodewriter.writerow(values)
...