Я пытаюсь выучить Spark, следуя некоторому примеру уровня приветствия, например ниже, используя pyspark
.Я получил ошибку «Метод isBarrier ([]) не существует», полная ошибка включена ниже кода.
from pyspark import SparkContext
if __name__ == '__main__':
sc = SparkContext('local[6]', 'pySpark_pyCharm')
rdd = sc.parallelize([1, 2, 3, 4, 5, 6, 7, 8])
rdd.collect()
rdd.count()
Хотя, когда я запускаю сеанс pyspark в командной строке напрямую и набираю тот же код, он отлично работает:
Моя настройка:
- windows 10 Pro x64
- python 3.7.2
- spark 2.3.3 hadoop 2.7
- pyspark 2.4.0