Я пытаюсь развернуть искровое задание (используя библиотеки pyspark: ML) в EMS aws.
Я хочу создать простой кластер с одним экземпляром, чтобы понять, как работает EMR.
Я создаю кластер с консолью со следующей конфигурацией:
spark-submit --deploy-mode cluster s3://bucket/key/file.py
Мой шаг терпит неудачу с кучей журналов ошибок, которые я изо всех сил пытаюсь понять, кроме этого:
File "PowerProdPredictionEmr.py", line 261
df = df.select("Perimetre", *target_exprs, *window_exprs, "rn")
SyntaxError: invalid syntax
Что я не понимаю, так как он работает локально на моей машине.
Вот код:
...
window_exprs = [df.power_prod[i] for i in range(w*sample_week)]
df = df.select("Perimetre", *target_exprs, *window_exprs, "rn")
...
Есть идеи? Я могу добавить другие файлы журнала, если это необходимо.