Я пытаюсь запустить простое задание pyspark в Amazon AWS, и он настроен на использование Yarn через файл spark-default.conf. Я немного озадачен кодом развертывания пряжи.
Я вижу некоторый пример кода, как показано ниже:
conf = SparkConf()
conf.setMaster('yarn-client')
conf.setAppName('spark-yarn')
sc = SparkContext(conf=conf)
И я не уверен, как мне выполнить задание spark в этом случае, когда указан 'yarn-client'. Я обычно делаю это следующим образом:
$spark-submit --deploy-mode client spark-job.py
Но в чем разница между
$spark-submit --deploy-mode client spark-job.py
и
$spark-submit spark-job.py
Как мне определить, смотрит ли на искровые журналы работа выполнялась в режиме клиента или кластера или клиента пряжи?