У нас есть рабочий процесс Oozie с некоторыми действиями Spark, Hive и SSH. Иногда рабочий процесс не выполняется из-за некоторых особых проблем. И почти всегда сбойный экземпляр преуспевает после его повторного запуска. Однако я не смог найти какие-либо параметры автоматической повторной попытки на уровне рабочего процесса или на уровне координатора.
Я видел, что в Действиях есть варианты повторных попыток, такие как количество повторных попыток и длительность повторной попытки. Пока это поможет в качестве обходного пути - но мне стало интересно, действительно ли у рабочих процессов нет таких опций?
Рабочие процессы и координаторы создаются и поддерживаются с использованием редактора Hue (3.12), а не напрямую через файл XML.