В программе, которую я извлек из csv из Excel, мне нужно загрузить CSV в hdfs и сохранить его в формате паркета, не имеет значения с версией Python или Spark, пожалуйста, без Scala.
Почти все обсуждения, с которыми я сталкивался, касаются блока данных, однако, кажется, не удается найти файл, вот код и ошибка:
df = sqlContext.read.format("com.databricks.spark.csv").option("header", "true").option("inferSchema","true").option("delimiter",",").load("file:///home/rxie/csv_out/wamp.csv")
Ошибка:
java.io.FileNotFoundException: Файл файла: /home/rxie/csv_out/wamp.csv
не существует
Путь к файлу:
ls -la /home/rxie/csv_out/wamp.csv
-rw-r--r-- 1 rxie linuxusers 2896878 Nov 12 14:59 /home/rxie/csv_out/wamp.csv
Спасибо.