Я могу прочитать обычный файл с:
textFile = sc.textFile("README.md")
, но как прочитать файл Parquet?
parquetFile = sqlContext.read.parquet("people.parquet") or in your case parquetFile = sc.read.parquet("people.parquet")
Я бы прочитал документацию здесь для получения дополнительной информации: https://spark.apache.org/docs/1.6.0/sql-programming-guide.html#hive-metastore-parquet-table-conversion
data = sqlContext.read.parquet("/tmp/testParquet") display(data)