Наконец, после некоторых исследований, нашел ответ на мой вопрос.
Приложение Spark состоит из драйвера и одного или нескольких исполнителей. Программа драйвера создает экземпляр SparkContext, который координирует исполнителей для запуска приложения Spark. Эта информация отображается в веб-интерфейсе Spark History Server « Активные задания ».
Исполнители запускают задачи, назначенные драйвером.
Когда приложение Spark работает на YARN, оно имеет собственную реализацию клиента Yarn и мастера приложения Yarn.
В приложении YARN есть клиент Yarn, мастер приложения Yarn и список контейнеров, запущенных на менеджерах узлов.
В моем случае Yarn работает в автономном режиме, поэтому программа драйвера работает как нить мастера приложения Yarn. Клиент Yarn получает статус от мастера приложения, а мастер приложения координирует контейнеры для выполнения задач.
Это запущенное задание можно отслеживать на странице приложений YARN в консоли администратора Cloudera Manager, когда оно работает .
Если приложение выполнено успешно, сервер истории отобразит список разделов ' Завершенные задания ', а также раздел * Активные задания ', которые будут удалены .
Если приложение завершается с ошибкой на уровне контейнеров, и YARN передает эту информацию драйверу, сервер истории отобразит список разделов ' Failed Jobs ', а также раздел Active Jobs '. удален .
Тем не менее, если приложение завершается сбоем на уровне контейнеров и YARN не может сообщить об этом драйверу, то заданное экземпляром Driver задание переходит в состояние забытия. Он думает, что задание все еще выполняется, и продолжает ждать ответа от мастера приложений YARN о состоянии задания. Следовательно, в History Server он по-прежнему отображается в ' Активных заданиях ' как , работающий .
Итак, мой вывод от этого:
Чтобы проверить состояние запущенного задания, перейдите на страницу приложений YARN в консоли администратора Cloudera Manager или используйте команду YARN CLI.
После завершения / сбоя задания откройте Spark History Server, чтобы получить более подробную информацию об использовании ресурсов, DAG и информации о сроках выполнения.