Я пытался загрузить локальный файл как фрейм данных с использованием spark_session и sqlContext.
df = spark_session.read...load(localpath)
Не удалось прочитать локальные файлы.дф пуст.Но после создания sqlcontext из spark_context он мог загрузить локальный файл.
sqlContext = SQLContext(spark_context)
df = sqlContext.read...load(localpath)
Работало нормально.Но я не могу понять почему.В чем причина?
Envionment: Windows10, spark 2.2.1
EDIT
Наконец-то я решил эту проблему.Основной причиной является разница версий между PySpark, установленным с помощью pip, и PySpark, установленным в локальной файловой системе.PySpark не удалось запустить из-за сбоя py4j.