Как читать файлы XML с начальными тегами в R - PullRequest
1 голос
/ 10 мая 2019

У меня есть несколько файлов XML, в которых отсутствует начальный тег. Например, это правильный форматированный файл: -

<?xml version="1.0"?>
<UDI>
<Test_Equipment_Number>3300061-01</Test_Equipment_Number>
<Test_SW_Number>3300062</Test_SW_Number>
<Test_SW_Version>2.1</Test_SW_Version>
<GTIN>(01)00884838088597</GTIN>
<LOT></LOT>
<Date_of_Mfg>(11)20190322</Date_of_Mfg>
<Device_SN>(21)1160001242</Device_SN>
<Material_Number>(96)300001287651</Material_Number>
<PCBA_WO_and_SN>00190311-0001242</PCBA_WO_and_SN>
<FW_Version>06</FW_Version>
<Model>324PHB</Model>
</UDI>

А это файл с отсутствующим начальным тегом: -

<Test_Equipment_Number>3300011-01</Test_Equipment_Number>
<Test_SW_Number>3300012</Test_SW_Number>
<Test_SW_Version>5.1</Test_SW_Version>
<GTIN>(01)00884838085497</GTIN>
<LOT></LOT>
<Date_of_Mfg>(11)20190411</Date_of_Mfg>
<Device_SN>(21)1120104548</Device_SN>
<Material_Number>(96)300000267981</Material_Number>
<PCBA_WO_and_SN>000143-00000793</PCBA_WO_and_SN>
<FW_Version>V01.0001</FW_Version>
<Model>7000PHW</Model>

Как я могу прочитать файл с отсутствующим начальным тегом на языке программирования R?

1 Ответ

1 голос
/ 10 мая 2019

Один из вариантов - проанализировать фрагмент xml, указав верхний узел для добавления:

# install.packages('XML')
library(XML)

fragment <- 
'<Test_Equipment_Number>3300011-01</Test_Equipment_Number>
<Test_SW_Number>3300012</Test_SW_Number>
<Test_SW_Version>5.1</Test_SW_Version>
<GTIN>(01)00884838085497</GTIN>
<LOT></LOT>
<Date_of_Mfg>(11)20190411</Date_of_Mfg>
<Device_SN>(21)1120104548</Device_SN>
<Material_Number>(96)300000267981</Material_Number>
<PCBA_WO_and_SN>000143-00000793</PCBA_WO_and_SN>
<FW_Version>V01.0001</FW_Version>
<Model>7000PHW</Model>'

XML::parseXMLAndAdd(fragment, top = 'content')
#> <content>
#>   <Test_Equipment_Number>3300011-01</Test_Equipment_Number>
#>   <Test_SW_Number>3300012</Test_SW_Number>
#>   <Test_SW_Version>5.1</Test_SW_Version>
#>   <GTIN>(01)00884838085497</GTIN>
#>   <LOT/>
#>   <Date_of_Mfg>(11)20190411</Date_of_Mfg>
#>   <Device_SN>(21)1120104548</Device_SN>
#>   <Material_Number>(96)300000267981</Material_Number>
#>   <PCBA_WO_and_SN>000143-00000793</PCBA_WO_and_SN>
#>   <FW_Version>V01.0001</FW_Version>
#>   <Model>7000PHW</Model>
#> </content>
...