Расшифровка кластерного режима v клиентского режима в EMR - PullRequest
0 голосов
/ 10 декабря 2018

У меня есть кластер EMR, состоящий из главного узла и рабочих узлов.Пряжа является менеджером кластера.Я использую rsync, чтобы передать свой код Python мастеру, а затем войти в систему через ssh и вызвать spark-submit.В каком режиме это работает?

Согласно книге "Spark: полное руководство". В режиме кластера менеджер кластера запускает процесс драйвера на рабочем узле внутри кластера.

В режиме клиента драйвер Spark остается на клиентском компьютере, который отправил приложение.

В моем случае процесс драйвера запускается на главном узле внутри кластера, а главный узел является клиентоммашина.Так работает ли моя установка в режиме клиента или в режиме кластера?

Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...