Это распространено в мире встраиваемых систем и в телекоммуникациях. Это гораздо реже встречается в мире на основе серверов.
Есть исследовательская группа, которая может вас заинтересовать. Они работают над Восстановительно-ориентированными вычислениями или "ROC". Ключевой принцип в ROC - это то, что самое чистое, лучшее, самое надежное состояние, в котором может находиться любая программа, - это сразу после запуска. Поэтому при обнаружении сбоя они предпочитают перезапускать программное обеспечение, а не пытаться восстанавливаться после сбоя.
Звучит достаточно просто, верно? Ну, большая часть исследований была направлена на реализацию этой идеи. Причина именно в том, что вы и другие комментаторы указали: перезапуски ОС слишком медленные, чтобы быть жизнеспособным методом восстановления.
РПЦ опирается на три основные части:
- Метод выявления неисправностей как можно раньше.
- Средство изоляции неисправного компонента при сохранении остальной части системы.
- Перезапуск на уровне компонентов.
Реальное ключевое различие между ROC и типичным подходом «ночной перезагрузки» заключается в том, что ROC - это стратегия, в которой перезагрузки являются реакцией. Я имею в виду, что большая часть программного обеспечения написана с некоторой степенью обработки ошибок и их восстановления (бросание и отлов, логирование, повторные циклы и т. Д.). Программа ROC обнаружит ошибку (исключение) и немедленно выход. Смешение двух парадигм просто оставляет вам худшее из обоих миров - низкую надежность и ошибки.