Question

Когда я читаю файл паркета на s3 из контекста sparklyr, вот так:

{spark_read_parquet(sc, name = "parquet_test", path = "s3a://<path-to-file>")}

выдает ошибку:

Причина: java.io.IOException: Не удалось прочитать нижний колонтитул для файла: FileStatus {path = s3a: .....

Мне удалось прочитать файл паркета в сеансе sparkR с помощью функции read.parquet (). Таким образом, должны быть некоторые различия с точки зрения конфигурации контекста искры между sparkR и sparklyr.

Есть предложения по этому вопросу? Спасибо.

Miguel A. Friginal · Answer 1 · 13 апреля 2019

В режиме yarn-client используемая вами схема файла s3 неверна.Вам нужно будет использовать s3://<path-to-file>

sparklyr spark_read_parquet от s3 ошибка

Пожалуйста, войдите или зарегистрируйтесь чтобы ответить на этот вопрос.

1 Ответ

Пожалуйста, войдите или зарегистрируйтесь что бы добавить комментарий.

sparklyr spark_read_parquet от s3 ошибка

Пожалуйста, войдите или зарегистрируйтесь чтобы ответить на этот вопрос.

1 Ответ

Пожалуйста, войдите или зарегистрируйтесь что бы добавить комментарий.

Похожие темы