Было бы очень сложно подвести итог в одной статье, поскольку в программном обеспечении существует множество способов обеспечения отказоустойчивости. Эти принципы касаются приложений для настольных компьютеров, серверов и / или SOA. Также существует несколько методологий, немногим из которых мы уже следуем, не зная; Обработка исключений, например. Было бы невероятным подвигом попытаться раскрыть все концепции в одной статье. Вы можете найти много статей с помощью простого поиска в Google.
Для моего FYP я исследовал системы самовосстановления во всей ОС. Я следовал за архитектурой Sun Solaris 10 и исследованиями IBM по автономным вычислениям (http://www.research.ibm.com/autonomic/).