Решение для фильтрации определенных строк в файле xml и последующего переноса в Excel или новый файл xml - PullRequest
0 голосов
/ 17 июня 2020

GoodDay Всем, я новичок в этой работе и не имею большого опыта программирования. Вам очень понадобится ваша добрая помощь. Мне было поручено отфильтровать определенную информацию из файла данных XML и передать ее в формат Excel. Это был файл со списком продуктов XML, содержащий дубликаты приведенных ниже строк из-за тысяч различных деталей продукта. Мне нужна эта <cpe-23:cpe23-item name="cpe:2.3:a:\$0.99_kindle_books_project:\$0.99_kindle_books:6:*:*:*:*:android:*:*"/> строка каждого продукта. Поскольку он содержит атрибуты cpe, которые мне нужно передать в таблицу данных формата Excel.

Во-первых, могу ли я узнать, есть ли простые методы для фильтрации или передачи только строк, содержащих cpe-23: cpe23-item name = в исходный файл XML.

Наконец, решение для плавного экспорта в лист Excel, начальный размер файла теперь составляет 190 МБ.

Пожалуйста, см. ниже, это одна из строк элемента в XML файл,

<cpe-item name="cpe:/a:%240.99_kindle_books_project:%240.99_kindle_books:6::~~~android~~">
    <title xml:lang="en-US">$0.99 Kindle Books project $0.99 Kindle Books (aka com.kindle.books.for99) for android 6.0</title>
    <references>
      <reference href="https://play.google.com/store/apps/details?id=com.kindle.books.for99">Product information</reference>
      <reference href="https://docs.google.com/spreadsheets/d/1t5GXwjw82SyunALVJb2w0zi3FoLRIkfGPc7AMjRF0r4/edit?pli=1#gid=1053404143">Government Advisory</reference>
    </references>
    <cpe-23:cpe23-item name="cpe:2.3:a:\$0.99_kindle_books_project:\$0.99_kindle_books:6:*:*:*:*:android:*:*"/>
  </cpe-item>

TYVM!

...