Question

Мы пытаемся прочитать файл .csv в S3, используя Spark, но получаем эту ошибку:

py4j.protocol.Py4JJavaError: An error occurred while calling o32.load.
: org.apache.spark.SparkException: Job aborted due to stage failure: Task 0 in stage 0.0 failed 4 times, most recent failure: Lost task 0.3 in stage 0.0 (TID 3, 10.50.94.133, executor 0): java.io.IOException: Could not read footer for file: FileStatus{path=s3a://edl-dfs-sas-cecl-dev/output/dev/dev10/h2o/extend_subset.csv; isDirectory=false; length=897466691973; replication=0; blocksize=0; modification_time=0; access_time=0; owner=; group=; permission=rw-rw-rw-; isSymlink=false}

Что можно сделать, чтобы избежать этой ошибки?

Anil Kumar · Answer 1 · 09 июня 2018

Я умею отлично читать с оболочки pyspark в spark 2.2 Проверьте скриншот .

Невозможно воспроизвести проблему.

Как правильно прочитать файл .csv в S3 из Spark?- Не удается прочитать нижний колонтитул для файла

Пожалуйста, войдите или зарегистрируйтесь чтобы ответить на этот вопрос.

1 Ответ

Пожалуйста, войдите или зарегистрируйтесь что бы добавить комментарий.

Как правильно прочитать файл .csv в S3 из Spark?- Не удается прочитать нижний колонтитул для файла

Пожалуйста, войдите или зарегистрируйтесь чтобы ответить на этот вопрос.

1 Ответ

Пожалуйста, войдите или зарегистрируйтесь что бы добавить комментарий.

Нет похожих вопросов