Я работаю над проблемой пакетной обработки. Решение должно работать с неисправным оборудованием.
Существует главный узел (который инициирует выполнение задач) и рабочие узлы, которые выполняют задания. Я знаю, как работает восстановление после отказа рабочих узлов, но я не смог найти никакой информации о восстановлении после отказа основных узлов. Всякий раз, когда мастер-узел, запустивший задачу, выходит из строя, вся задача отменяется.
Есть ли способ завершить обработку задачи?
Не могли бы вы предложить лучший способ реализации отработки отказа главного узла?
С уважением,
Kuba