Question

Волшебники сообщества,

Я действительно разочарован. Когда дело доходит до Spark, Had oop и др., Все кажется простым.

В последние часы я пытался найти решение следующей проблемы:

ERROR Executor: Exception in task 0.0 in stage 13.0 (TID 823)
java.lang.UnsatisfiedLinkError: org.apache.hadoop.io.nativeio.NativeIO$Windows.createFileWithMode0(Ljava/lang/String;JJJI)Ljava/io/FileDescriptor;

Версии :

ОС: Windows 10
Версия Spark: 2.4.6
Scala версия: 2.11.12
Была oop версия: 2.7.1
Java версия: 1.8.0_202 (64-разрядная)

Переменные :

SPARK_HOME: C: \ Spark
HADOOP_HOME: C: \ Hadoop \ имел oop -2.7.1
SCALA_HOME: C: \ Program Files (x86) \ scala
JRE_HOME: C: \ Program Files \ Java \ jre1.8.0_202
JAVA_HOME: C: \ Program Files \ Java \ jdk1.8.0_202

Пути :

% SPARK_HOME% \ bin
% HADOOP_HOME% \ bin
% SCALA_HOME% \ bin
% JRE_HOME% \ bin
% JAVA_HOME% \ bin

Команда, которая вызывает ошибку:

df.coalesce(1).write.format("csv").save("result")

Папка (результат) кажется, создается, но он пуст.

Я буквально понятия не имею, как решить эту проблему.

Любая помощь будет тепло приветствоваться.

Feroz · Answer 1 · 13 июля 2020

Я считаю, что ваш HADOOP_HOME=C:\Hadoop\hadoop-2.7.1 указывает на Had oop Binaries / Libraries, вместо этого вам понадобится инструмент под названием WINUTILS.EXE для работы в Windows.

Вы можете скачать Had oop Версия winutils из git и сопоставьте HADOOP_HOME с Root каталогом Winutils. https://github.com/steveloughran/winutils

Источник:

Из Had oop Confluence: Had oop требует собственных библиотек на Windows для работать должным образом, включая доступ к файловой системе file: //, где Had oop использует некоторые Windows API для реализации разрешений доступа к файлам в стиле posix

https://cwiki.apache.org/confluence/display/HADOOP2/WindowsProblems

andreoss · Answer 2 · 13 июля 2020

Кажется, что у вас нет Бинарных файлов oop для Windows, установленных в каталоге HADOOP_HOME. Или может случиться так, что их зависимости (например, Visual C ++ Runtime) отсутствуют.

Вам также может потребоваться загрузить разделяемые библиотеки напрямую, это зависит от способа запуска приложения Spark.

System.load(System.getenv("HADOOP_HOME") + "/lib/hadoop.ddl");

Spark выдает ошибку при попытке сохранить файл CSV

Пожалуйста, войдите или зарегистрируйтесь чтобы ответить на этот вопрос.

Ответы [ 2 ]

Пожалуйста, войдите или зарегистрируйтесь что бы добавить комментарий.

Пожалуйста, войдите или зарегистрируйтесь что бы добавить комментарий.

Spark выдает ошибку при попытке сохранить файл CSV

Пожалуйста, войдите или зарегистрируйтесь чтобы ответить на этот вопрос.

Ответы [ 2 ]

Пожалуйста, войдите или зарегистрируйтесь что бы добавить комментарий.

Пожалуйста, войдите или зарегистрируйтесь что бы добавить комментарий.

Похожие темы