Когда искровое задание передается водителю (мастеру), мало что происходит
- Программа-драйвер создает план выполнения. Он создает несколько этапов, и каждый этап содержит несколько задач.
- Диспетчер кластеров распределяет ресурсы и запускает исполнителей из рабочего на основе аргументов при отправке задания.
- Задачи передаются исполнителям, которые должны быть выполнены, и водитель следит за выполнением каждой задачи. Ресурсы освобождаются, и исполнители закрываются, когда закрывается
sparkContext
или завершается область действия прикладной программы.
Драйвер или мастер, на который отправляется искровое задание, нуждается в доступном пути к данным, поскольку он контролирует весь план выполнения. Программа-драйвер и менеджер кластера позаботятся обо всех действиях, выполняемых на рабочем месте. Поскольку задание spark отправляется в master, достаточно указать путь к данным, доступ к которому возможен в spark с главного компьютера.