1) Есть ли способ автоматического определения отказа одного узла с другого узла?
2) Есть ли способ автоматического перезапуска узла, который только что вышел из строя?
Что касается моего второго вопроса, я нашел в Google и не могу найти упоминания о создании узлов изcode / at runtime.
Я понимаю, что вы можете сделать это с процессами - создание процессов во время выполнения тривиально, и если вы хотите знать, когда они завершаются аварийно, вы можете создать их из супервизора и т.д.обнаружение / создание узла.
Это необходимо для клиента, который хочет создать уменьшенную версию Amazon EDS, но я не могу представить, чтобы Amazon вручную перезапускал узлы, если они отключаются!