Возникли проблемы с преобразованием вложенного XML в CSV с помощью Powershell - PullRequest
1 голос
/ 15 мая 2019

У меня есть вложенный XML, который мне нужно преобразовать в CSV с помощью Powershell. К сожалению, я более новичок и не смог решить эту проблему с помощью существующих тем, которые я нашел в Интернете.

Я пытался это сделать, прочитав XML-файл в Powershell и создав новый объект, но мой экспорт в csv даже не дал этого недостаточного результата ...: (

XML-файл, который у меня есть, выглядит следующим образом:

<?xml version="1.0" encoding="ISO-8859-1"?>
<Data source="Jhonny" datetime="2019-04-23T10:07:50+02:00" timezone="Europe">
    <dealerships>
        <location name="Germany">
            <series parameter="Sold Cars" unit="car">
                <value datetime="2019-04-22T00:00:00+02:00" value="7.3"/>
                <value datetime="2019-04-22T01:00:00+02:00" value="7.8"/>
                <value datetime="2019-04-22T02:00:00+02:00" value="7.0"/>
                <value datetime="2019-04-22T03:00:00+02:00" value="6.0"/>
            </series>
            <series parameter="Sold Cars" unit="Auto">
                <value datetime="2019-04-22T00:00:00+02:00" value="4.0"/>
                <value datetime="2019-04-22T01:00:00+02:00" value="4.0"/>
                <value datetime="2019-04-22T02:00:00+02:00" value="4.0"/>
                <value datetime="2019-04-22T03:00:00+02:00" value="4.0"/>
            </series>
        </location>
        <location name="USA">
            <series parameter="Sold Cars" unit="car">
                <value datetime="2019-04-22T00:00:00+02:00" value="5.1"/>
                <value datetime="2019-04-22T01:00:00+02:00" value="4.1"/>
                <value datetime="2019-04-22T02:00:00+02:00" value="3.6"/>
                <value datetime="2019-04-22T03:00:00+02:00" value="3.1"/>
            </series>
            <series parameter="Sold Cars" unit="Auto">
                <value datetime="2019-04-22T00:00:00+02:00" value="3.0"/>
                <value datetime="2019-04-22T01:00:00+02:00" value="3.0"/>
                <value datetime="2019-04-22T02:00:00+02:00" value="3.0"/>
                <value datetime="2019-04-22T03:00:00+02:00" value="3.0"/>
            </series>
        </location>
    </dealerships>
</Data>

Результат, к которому я стремлюсь, будет выглядеть так:

Location;Date/Time;Sold Cars car;Sold Cars Auto
Germany; 2019-04-22T00:00:00+02:00; 7.3;4.0
Germany; 2019-04-22T00:00:00+02:00; 7.8;5.0
Germany; 2019-04-22T00:00:00+02:00; 7.0;3.0
Germany; 2019-04-22T00:00:00+02:00; 6.0;4.0
USA; 2019-04-22T00:00:00+02:00; 5.1;3.0
USA; 2019-04-22T00:00:00+02:00; 4.1;6.0
USA; 2019-04-22T00:00:00+02:00; 3.6;1.0
USA; 2019-04-22T00:00:00+02:00; 3.1;8.0

Поскольку я на самом деле нигде не получил, я не думаю, что мой код помогает, но вот как я пытался ее решить, но не получилось:

$xml = "C:\Users\[me]\Convert_XML_to_CSV\cars.xml"
$obj = New-Object System.XML.XMLDocument
$obj.Load("$xml")

foreach ($i in $_.Data.dealerships.location) {
    $o = New-Object Object
    Add-Member -InputObject $o -MemberType NoteProperty -Name location -Value $obj.Data.dealerships.Location $i $o
} | Export-Csv "result.csv" -Delimiter "," -NoType -Encoding UTF8

Ответы [ 2 ]

2 голосов
/ 15 мая 2019

Возможно, не совсем то, что показывает желаемый результат, но это может помочь.

Примечание: я использую здесь строку для XML. В вашем случае загрузите его из файла, используя

[xml]$xml = Get-Content "C:\Users\[me]\Convert_XML_to_CSV\cars.xml"

Код:

[xml]$xml = @'
<?xml version="1.0" encoding="ISO-8859-1"?>
<Data source="Jhonny" datetime="2019-04-23T10:07:50+02:00" timezone="Europe">
    <dealerships>
        <location name="Germany">
            <series parameter="Sold Cars" unit="car">
                <value datetime="2019-04-22T00:00:00+02:00" value="7.3"/>
                <value datetime="2019-04-22T01:00:00+02:00" value="7.8"/>
                <value datetime="2019-04-22T02:00:00+02:00" value="7.0"/>
                <value datetime="2019-04-22T03:00:00+02:00" value="6.0"/>
            </series>
            <series parameter="Sold Cars" unit="Auto">
                <value datetime="2019-04-22T00:00:00+02:00" value="4.0"/>
                <value datetime="2019-04-22T01:00:00+02:00" value="4.0"/>
                <value datetime="2019-04-22T02:00:00+02:00" value="4.0"/>
                <value datetime="2019-04-22T03:00:00+02:00" value="4.0"/>
            </series>
        </location>
        <location name="USA">
            <series parameter="Sold Cars" unit="car">
                <value datetime="2019-04-22T00:00:00+02:00" value="5.1"/>
                <value datetime="2019-04-22T01:00:00+02:00" value="4.1"/>
                <value datetime="2019-04-22T02:00:00+02:00" value="3.6"/>
                <value datetime="2019-04-22T03:00:00+02:00" value="3.1"/>
            </series>
            <series parameter="Sold Cars" unit="Auto">
                <value datetime="2019-04-22T00:00:00+02:00" value="3.0"/>
                <value datetime="2019-04-22T01:00:00+02:00" value="3.0"/>
                <value datetime="2019-04-22T02:00:00+02:00" value="3.0"/>
                <value datetime="2019-04-22T03:00:00+02:00" value="3.0"/>
            </series>
        </location>
    </dealerships>
</Data>
'@ 

$result = foreach ($item in $xml.Data.dealerships.location) {
    $location = $item.Name

    # get the different column names
    $units = $item.series | ForEach-Object { '{0} {1}' -f $_.parameter, $_.unit}

    # loop through the series
    foreach ($series in $item.series) {
        # and the values
        foreach ($value in $series.value) {
            # since you are using PowerShell 2.0, create the output object like this
            $objOut = New-Object -TypeName PSObject
            $objOut | Add-Member -MemberType NoteProperty -Name 'Location' -Value $location
            $objOut | Add-Member -MemberType NoteProperty -Name 'DateTime' -Value $value.datetime

            $thisUnit = '{0} {1}' -f $series.parameter, $series.unit
            # add the different units as property.
            foreach ($unit in $units) { 
                $val = if ($unit -eq $thisUnit) { $value.value } else { '' }
                $objOut | Add-Member -MemberType NoteProperty -Name $unit -Value $val 
            }

            # output the object
            $objOut
        }
    }
}

# output on screen
$result | Format-Table -AutoSize
# output to CSV file
$result | Export-Csv -Path 'D:\test.csv' -Encoding UTF8 -NoTypeInformation

Результат:

Location DateTime                  Sold Cars car Sold Cars Auto
-------- --------                  ------------- --------------
Germany  2019-04-22T00:00:00+02:00 7.3                         
Germany  2019-04-22T01:00:00+02:00 7.8                         
Germany  2019-04-22T02:00:00+02:00 7.0                         
Germany  2019-04-22T03:00:00+02:00 6.0                         
Germany  2019-04-22T00:00:00+02:00               4.0           
Germany  2019-04-22T01:00:00+02:00               4.0           
Germany  2019-04-22T02:00:00+02:00               4.0           
Germany  2019-04-22T03:00:00+02:00               4.0           
USA      2019-04-22T00:00:00+02:00 5.1                         
USA      2019-04-22T01:00:00+02:00 4.1                         
USA      2019-04-22T02:00:00+02:00 3.6                         
USA      2019-04-22T03:00:00+02:00 3.1                         
USA      2019-04-22T00:00:00+02:00               3.0           
USA      2019-04-22T01:00:00+02:00               3.0           
USA      2019-04-22T02:00:00+02:00               3.0           
USA      2019-04-22T03:00:00+02:00               3.0


Обновление

В соответствии с вашим комментарием вы можете дополнительно объединить / сгруппировать массив $result из приведенного выше кода следующим образом:

$combined = $result | Group-Object -Property DateTime, Location | ForEach-Object {
    foreach ($location in ($_.Group | Group-Object Location)) {
        # create an output object and put in the Location property here
        $objOut = New-Object -TypeName PSObject
        $objOut | Add-Member -MemberType NoteProperty -Name 'Location' -Value ($location.Name)
        foreach ($date in ($location.Group | Group-Object DateTime)) {
            # add the DateTime property
            $objOut | Add-Member -MemberType NoteProperty -Name 'DateTime' -Value ($date.Name)
            foreach ($unit in $_.Group) {
                # join the other two properties to the $objOut object:
                # I do not want to hard-code the property names here, 
                # so use Select-Object to get the remaining props.
                $sold = $unit | Select-Object * -ExcludeProperty Location, DateTime
                foreach ($thing in $sold.psobject.properties | Where-Object { ($_.Value) }) {
                    # if you want the numbers as floating-point numbers, do this:
                    # $objOut | Add-Member -MemberType NoteProperty -Name $($thing.Name) -Value ([double]$thing.Value)
                    # like below, these values will be output as string
                    $objOut | Add-Member -MemberType NoteProperty -Name $($thing.Name) -Value ($thing.Value)
                }
            }
        }
        $objOut
    }
}

# output on screen
$combined | Format-Table -AutoSize
# output to CSV file
$combined | Export-Csv -Path 'D:\test_Grouped.csv' -Encoding UTF8 -NoTypeInformation

Это приведет к:

Location DateTime                  Sold Cars car Sold Cars Auto
-------- --------                  ------------- --------------
Germany  2019-04-22T00:00:00+02:00 7.3           4.0           
Germany  2019-04-22T01:00:00+02:00 7.8           4.0           
Germany  2019-04-22T02:00:00+02:00 7.0           4.0           
Germany  2019-04-22T03:00:00+02:00 6.0           4.0           
USA      2019-04-22T00:00:00+02:00 5.1           3.0           
USA      2019-04-22T01:00:00+02:00 4.1           3.0           
USA      2019-04-22T02:00:00+02:00 3.6           3.0           
USA      2019-04-22T03:00:00+02:00 3.1           3.0
1 голос
/ 15 мая 2019

Этот был немного хитрым. Я справился с этим, проанализировав XML с использованием встроенных возможностей синтаксического анализа PowerShell, затем пошагово просматривая узлы с помощью .location, что дает нам список с разбивкой по местоположению (таким образом, у нас будет один для США, один для Германии и т. Д.)

В первом цикле у нас есть две серии для каждой локации, одна с единицей автомобиля и одна с единицей Autos. Итак, затем мы находим series с unit из car, чтобы продать все автомобили. Тогда мы foreach пробиваемся через них.

В самом глубоко вложенном цикле, cars, мы находим совпадающую запись из серии Auto, совпадающую по дате и времени.

Это дает нам все свойства, необходимые для создания PSCustomObject в формате PowerShell 2.0. Я проверил, и желаемый результат выглядит в соответствии с тем, что вы искали.

$dealerships = ([xml]$x).Data.dealerships.location

foreach ($location in $dealerships){
    $cars = $location.series | Where-Object {$_.unit -eq 'car'}
    foreach ($car in $cars.value){
        $auto = $location.series | Where-Object {$_.unit -eq 'Auto'} | Select-Object -ExpandProperty value | Where-Object {$_.datetime -eq $car.datetime}

        $ObjectProperties = @{
            Location = $location.name
            DateTime = $car.datetime
            SoldCars = $car.value
            SoldAutos= $auto.value
        }
        New-Object PSObject -Property $ObjectProperties
    }
}
Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...