Как добавить атрибут и значение к тегу xml в scala (spark) с помощью блока данных - PullRequest
0 голосов
/ 16 октября 2019

Мне нужно добавить «xml: lang» в качестве атрибута и «рубашку» в качестве значения в теге display-name в spark scala с использованием блоков данных. Пожалуйста помоги. например - <display-name xml:lang="x-default">Shirt</display-name>

1 Ответ

0 голосов
/ 22 октября 2019

Один из способов - использовать библиотеку spark-xml блоков данных, как показано ниже:

  1. Импортировать библиотеку spark-xml в ваше рабочее пространство ИЛИ
  2. Присоединить библиотеку к кластеру

enter image description here

Используйте следующий код в своей записной книжке, чтобы прочитать файл xml, где «note» - это корень моего файла xml.

xmldata = spark.read.format ('xml') .option ("rootTag", "note"). load (' dbfs: /mnt/mydatafolder/xmls/note.xml ') display (xmldata)

Пример:

enter image description here

Подробнее см. " Источники данных XML для Apache Spark ".

Надеюсь, это поможет.

Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...