Вы должны использовать тег --deploy-mode cluster
, который позволит вам развернуть несколько выполнений в вашем кластере. Это заставит пряжу обрабатывать ресурсы и очереди для вас.
Полный пример:
spark-submit \
--class org.apache.spark.examples.SparkPi \
--master yarn \
--deploy-mode cluster \ # can be client for client mode
--executor-memory 20G \
--num-executors 50 \
/path/to/examples.jar \
1000
Подробнее здесь .