Question

Почему этот подход не работает?

from pyspark.sql import SparkSession

spark = SparkSession.builder.appName('session').getOrCreate()
df = spark.range(5).toDF("index")
filepath = r"C:/my_favorite_directory"
df.write.csv(filepath)

Обновление

Приведенный выше код работает нормально, проблема заключалась в том, что я не указал имел oop двоичный путь для ссылки на двоичный файл winutils, который необходим pyspark для записи csv-файлов.

j suman · Answer 1 · 21 марта 2020

Ваш путь к файлу должен заканчиваться .csv или расширением файла. Вы предоставляете каталог, который неправильный

Как сохранить DataFrame в виде csv-файла, используя pyspark?

Пожалуйста, войдите или зарегистрируйтесь чтобы ответить на этот вопрос.

1 Ответ

Пожалуйста, войдите или зарегистрируйтесь что бы добавить комментарий.

Как сохранить DataFrame в виде csv-файла, используя pyspark?

Пожалуйста, войдите или зарегистрируйтесь чтобы ответить на этот вопрос.

1 Ответ

Пожалуйста, войдите или зарегистрируйтесь что бы добавить комментарий.

Похожие темы