Как анализировать XML с непарными тегами, используя Nokogiri - PullRequest
1 голос
/ 30 марта 2019

Все примеры, которые можно увидеть в Интернете, представляют собой файлы XML со структурой, такой как:

<open_tag>data that I want</close_tag>

, но мой файл XML отличается:

<Report xmlns:xsi="http://www.w3.org/2001/XMLSchema-instance" xmlns="_x0034_00_x0020_-_x0020_Nomenklatury" xsi:schemaLocation="_x0034_00_x0020_-_x0020_Nomenklatury http://pcisrs/ReportServer?%2FTARIC%20Reporty%20Ciselnikov%2F400%20-%20Nomenklatury&rs%3AFormat=XML&rc%3ASchema=True" Name="400 - Nomenklatury">
<table1>
<Detail_Collection>
<Detail goods_nomenclature_item_id="0100000000" product_line="80" date_start="31.12.1971" quantity_indents="0" declarable_import="0" declarable_export="0" goods_nomenclature_item_description="ŽIVÉ ZVIERATÁ"/>
<Detail goods_nomenclature_item_id="0101000000" product_line="80" date_start="01.01.1972" quantity_indents="1" statistical_unit="NAR" declarable_import="0" declarable_export="0" goods_nomenclature_item_description="Živé kone, somáre, muly a mulice" parent_goods_nomenclature_item_id="0100000000" parent_product_line="80"/>

.....ETC....

</Detail_Collection>
</table1>
</Report>

Если я понимаю учебники, это должно работать:

 subor = Nokogiri::XML(File.open('vendor/financnasprava/nomenklatury/recent.xml'))
    dataset = subor.xpath('//Detail')

но не сделал.

1 Ответ

1 голос
/ 31 марта 2019

Вы можете работать с этими данными, как в примере ниже. Я удалил исходный путь, поскольку у меня нет этих данных локально.

Если я прав, и вы пытаетесь получить доступ к атрибутам сведений:

require 'nokogiri'
require 'open-uri'

data_xml = <<-EOT
<Report xmlns:xsi="http://www.w3.org/2001/XMLSchema-instance" Name="400 - Nomenklatury">
<table1>
<Detail_Collection>
<Detail goods_nomenclature_item_id="0100000000" product_line="80" date_start="31.12.1971" quantity_indents="0" declarable_import="0" declarable_export="0" goods_nomenclature_item_description="ŽIVÉ ZVIERATÁ"/>
<Detail goods_nomenclature_item_id="0101000000" product_line="80" date_start="01.01.1972" quantity_indents="1" statistical_unit="NAR" declarable_import="0" declarable_export="0" goods_nomenclature_item_description="Živé kone, somáre, muly a mulice" parent_goods_nomenclature_item_id="0100000000" parent_product_line="80"/>
</Detail_Collection>
</table1>
</Report>
EOT
subor = Nokogiri::XML(data_xml)
dataset = subor.xpath('//Detail_Collection/*')
details = dataset.map do |row|
  {
    product_line: row.attributes['product_line'].value,
    goods_nomenclature_item_id: row.attributes['goods_nomenclature_item_id'].value
  }
end

puts details

#=> {:product_line=>"80", :goods_nomenclature_item_id=>"0100000000"}
#=> {:product_line=>"80", :goods_nomenclature_item_id=>"0101000000"}
Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...