Я пытаюсь прочитать файл XML в своей записной книжке PySpark3 Jyupter (работает в Azure).
У меня есть этот код:
df = spark.read.load("wasb:///data/test/Sample Data.xml")
ОднакоЯ все время получаю сообщение об ошибке java.io.IOException: Could not read footer for file
:
An error occurred while calling o616.load.
: org.apache.spark.SparkException: Job aborted due to stage failure: Task 0 in stage 10.0 failed 4 times, most recent failure: Lost task 0.3 in stage 10.0 (TID 43, wn2-xxxx.cloudapp.net, executor 2): java.io.IOException: Could not read footer for file: FileStatus{path=wasb://xxxx.blob.core.windows.net/data/test/Sample Data.xml; isDirectory=false; length=6947; replication=0; blocksize=0; modification_time=0; access_time=0; owner=; group=; permission=rw-rw-rw-; isSymlink=false}
Я знаю, что оно достигает файла - от просмотра длины - соответствует размеру файла XML - но застряло после этого?
Есть идеи??
Спасибо.