Мне нравится статья LWN "Программное обеспечение только для сбоев" , и я хотел бы узнать больше о программировании, обеспечивающем отказоустойчивость и отказоустойчивость.
Удивительно трудно гарантировать, что постоянное состояние является последовательным в ситуациях сбоя. Здесь я даже не говорю о распределенных операциях: это сложно и для одного узла: даже обычная БД Berkeley (хранилище данных BDB или параллельное хранилище данных BDB) может иметь разрушенную базу данных в случае сбоя системы. Мало того, что ограничения приложения высокого уровня нарушены, база данных может быть не открыта правильно, если происходит сбой системы.
Каковы хорошие ресурсы об отказоустойчивых и отказоустойчивых проектах, подходах и программировании.
Если ресурсы сосредоточены на средах C ++ и POSIX, я был бы признателен за это.