Я пытаюсь прочитать xml-файл из amazon s3 на платформе pyspark блоков данных. Но это не в состоянии прочитать это. Вывод ничего не дает, когда я использую метод display (). Хотя я использую библиотеку spark-xml, чтобы прочитать его. Но это мне мало поможет.
Я использовал среду исполнения databricks 5.2 (включает Apache Spark 2.4.0, Scala 2.11).
df = spark.read \
.format("xml") \
.option('rootTag', 'breakfast_menu') \
.option('rowTag', 'food') \
.load('s3://*****/***/***/**/sample.xml')