pyspark - самый быстрый способ записи данных в csv - PullRequest
0 голосов
/ 23 апреля 2019

В настоящее время я записываю фрейм данных в csv , используя write.csv.

 df.withColumn("x", col("x").cast("string")).write.csv(path="mycsv",sep=";")

Но это очень медленно при записи миллионов и миллионов строк (уже день и до сих порБег).Есть ли способ сделать это быстрее?

...