df = spark.read.parquet('xxx')
tmstmp = df['timestamp']
spark.conf.set("spark.sql.session.timeZone", "Singapore")
time_df = spark.createDataFrame([('tmstmp',)], ['unix_time'])
time_df.select(from_unixtime('unix_time').alias('ts')).collect()
df['timestamp'] = time_df
spark.conf.unset("spark.sql.session.timeZone")
в этой строке есть ошибка:
time_df.select(from_unixtime('unix_time').alias('ts')).collect()
с ошибкой исключения msg:
Исключение: Python в рабочей версии отличается от версии 2.7, чем в драйвере 3.7, PySpark не может работать с другими второстепенными версиями. Проверьте, правильно ли установлены переменные окружения PYSPARK_PYTHON и PYSPARK_DRIVER_PYTHON.