Я использую код Python3 на кластерах блоков данных из Eclipse на MacBook.
Когда я запускаю:
spark = SparkSession.builder \
.master("local") \
.appName("Word Count") \
.config("spark.some.config.option", "some-value") \
.getOrCreate()
spark.createDataFrame(df_data) # df_data is a pandas dataframe,
Я получил ошибку:
Exception: Python in worker has different version 3.6 than that in driver 3.5, PySpark cannot run with different minor versions.Please check environment variables PYSPARK_PYTHON and PYSPARK_DRIVER_PYTHON are correctly set.
В моем затмении:
PYSPARK_PYTHON = pytohn3
PYSPARK_PYTHON = /Users/a_name/.pyenv/versions/3.6.0/bin/python
Итак, я хотел быпроверить Python версии драйвера и работника кластера данных из записной книжки.
import sys
print(sys.version)
Я получил:
3.6.5 |Anaconda, Inc.| [GCC 7.2.0]
import subprocess
python_version = subprocess.check_output(['python', '--version'], stderr=subprocess.STDOUT)
print(python_version)
Я получил:
b'Python 2.7.15 :: Anaconda, Inc.\n'
Я не знаю, почему здесь есть две версии Python? Я должен изменить версию Python моего кода Python в Eclipse?