Как импортировать пакет xml в блоки данных - PullRequest
0 голосов
/ 28 мая 2019

Любой, кто переходит по следующим ссылкам до xml https://github.com/databricks/spark-xml

У меня просто возникают проблемы при импорте импорта com.databricks.spark.xml ._

Ошибка

enter image description here

Моя версия базы данных

enter image description here

На самом деле я также хочу знать, как установитьпакет

$SPARK_HOME/bin/spark-shell --packages com.databricks:spark-xml_2.12:0.5.0

Ответы [ 2 ]

0 голосов
/ 28 мая 2019

Вы можете установить пакет / библиотеку, используя параметр библиотеки импорта, доступный на домашней странице databricks.

databricks-homepage

Здесь выберите параметр maven и укажите координаты maven или вы.иметь право поиска пакета также

maven

enter image description here

После этого вам необходимо прикрепитьбиблиотеки в ваш кластер, перейдя Кластеры> Библиотеки.Теперь вы можете напрямую использовать эту библиотеку, как показано ниже, без ее импорта.

df = spark.read.format('com.databricks.spark.xml').options(rowTag='book').load(' /FileStore/tables/sample.xml')
0 голосов
/ 28 мая 2019

Используйте эту зависимость в Android Studio:

// https://mvnrepository.com/artifact/com.databricks/spark-xml
compile group: 'com.databricks', name: 'spark-xml_2.12', version: '0.5.0'

Для получения дополнительной помощи перейдите по этой ссылке:

https://mvnrepository.com/artifact/com.databricks

...