NiFi xml пытается отделить текстовый узел с полуструктурированными данными - PullRequest
0 голосов
/ 04 августа 2020

Вот пример xml очень простого файла:

    <?xml version="1.0" encoding="UTF-8"?>
<bookstore><book category="children">
  <title lang="en">Harry Potter</title>
  <author>J K. Rowling</author>
  <year>2005</year>
  <price>29.99</price>
  <text>There are several harry potter books: -Chamber of Secrets -Goblet of Fire -</text>
</book>
</bookstore>

Используя NiFi, я хотел бы

  1. переименовать текстовое поле в books
  2. Затем создайте подполе book-items с Тайной комнатой в качестве одного элемента и Кубок огня другим элементом

Я использую процессор EvaluateXpath для извлечения значений. Я не знаю, как выделить текстовое поле как отдельные объекты

1 Ответ

0 голосов
/ 04 августа 2020

Вероятно, вы захотите использовать Apache NiFi RecordPath DSL для управления структурированными данными таким образом. RecordPath позволяет извлекать, изменять и обновлять поля с использованием обобщенного синтаксиса, аналогичного (но не равного) XPath, который применяется ко всем различным форматам данных, которые NiFi может интерпретировать как запись (CSV, XML, JSON, Avro и др. c.).

...