Question

Я работаю над windows 10. Я установил spark, и цель - использовать pyspark. Я сделал следующие шаги:

Я установил Python 3.7 с anaconda - Python был добавлен в C:\Python37
Я загружаю wintils из this ссылка - winutils добавлен к C:\winutils\bin
Я скачал spark - Искра была извлечена: C:\spark-3.0.0-preview2-bin-hadoop2.7
Я скачал Java 8 из AdoptOpenJDK

в системных переменных, я устанавливаю следующие переменные:

HADOOP_HOME: C:\winutils
SPARK_HOME: C:\spark-3.0.0-preview2-bin-hadoop2.7
JAVA_HOME: C:\PROGRA~1\AdoptOpenJDK\jdk-8.0.242.08-hotspot

И, наконец, в системном пути я добавил:

% JAVA_HOME% \ bin
% SPARK_HOME% \ bin
% HADOOP_HOME% \ bin

В терминале:

Итак, я хотел бы знать, почему я получаю это предупреждение:

unable to load native-hadoop library... And why I couldn't bind on port 4040...

Наконец, внутри Jupyter Notebook, Я получаю следующую ошибку при попытке записи в файл Parquet. Это изображение показывает рабочий пример, а следующий показывает код с ошибками:

А вот DataMaster__3.csv на моем диске:

И DaterMaster_par2222.parquet:

Любая помощь очень ценится !!

VoldyArrow · Answer 1 · 17 апреля 2020

Если вы пишете файл в формате csv, я обнаружил, что лучший способ сделать это - использовать следующий подход

LCL_POS.toPandas().to_csv(<path>)

Существует другой способ сохранить его напрямую без преобразования в pandas но проблема в том, что в итоге он разбивается на несколько файлов (со странными именами, поэтому я стараюсь их избегать). Если вы счастливы разбить файл на части, на мой взгляд, лучше написать файл для паркета.

LCL_POS.repartition(1).write.format("com.databricks.spark.csv").option("header", "true").save(<path>)

Надеюсь, что ответ на ваш вопрос.

Ошибка записи в файл паркета с использованием pyspark

Пожалуйста, войдите или зарегистрируйтесь чтобы ответить на этот вопрос.

1 Ответ

Пожалуйста, войдите или зарегистрируйтесь что бы добавить комментарий.

Ошибка записи в файл паркета с использованием pyspark

Пожалуйста, войдите или зарегистрируйтесь чтобы ответить на этот вопрос.

1 Ответ

Пожалуйста, войдите или зарегистрируйтесь что бы добавить комментарий.

Нет похожих вопросов