У меня есть кластер EMR, состоящий из главного узла и рабочих узлов.Пряжа является менеджером кластера.Я использую rsync, чтобы передать свой код Python мастеру, а затем войти в систему через ssh и вызвать spark-submit.В каком режиме это работает?
Согласно книге "Spark: полное руководство". В режиме кластера менеджер кластера запускает процесс драйвера на рабочем узле внутри кластера.
В режиме клиента драйвер Spark остается на клиентском компьютере, который отправил приложение.
В моем случае процесс драйвера запускается на главном узле внутри кластера, а главный узел является клиентоммашина.Так работает ли моя установка в режиме клиента или в режиме кластера?