Мы установили cloudera CDH 6.2 на машину RHEL 7, поставляемую по умолчанию python 2.7. Использование python 3.7 в виртуальной среде для создания искровых заданий pyspark. Клиентский режим с --master local и --deploy-mode client работает нормально. Но возникли проблемы с --master yarn и --deploy-mode cluster.
Эта команда spark-submit --master yarn --deploy-mode cluster --conf spark.yarn.appMasterEnv.PYSPARK_PYTHON=/home/user/R1_I5/bin/python --conf spark.yarn.appMasterEnv.SPARK_HOME=/opt/cloudera/parcels/CDH/lib/spark --conf spark.executorEnv.SPARK_HOME=/opt/cloudera/parcels/CDH/lib/spark sample.py
не работает с ошибками менее 2
Случай 1 Журнал ошибок : --deploy-mode cluster
Cannot run program "/home/user/R1_I5/bin/python": error=13, Permission denied
Подробный журнал: https://drive.google.com/file/d/1J7HLNGABnStJ91ISHFBMdNe5OLEUQZ6B/view
Случай 2 Журнал ошибок : --master yarn
Следующие две строки повторяются без завершения программы
INFO yarn.Client: Application report for application_1594339922772_0012 (state: ACCEPTED)
INFO yarn.SparkRackResolver: Got an error when resolving hostNames. Falling back to /default-rack for all