Нет, это только два обработчика ошибок, определенных стандартом в настоящее время.
Форум MPI в настоящее время работает над тем, что станет MPI-3, и обработкой ошибок и отказоустойчивостью.станет важным компонентом нового стандарта (есть рабочая группа , посвященная этой теме).Однако до тех пор, пока эта работа не будет завершена, единственный способ повысить отказоустойчивость MPI - это использовать более ранние, нестандартные расширения. FT-MPI - проект, который разработал очень надежный MPI, но, к сожалению, он основан на MPI1.2;очень ранняя версия стандарта.Есть MPICH-V , основанный на MPI2, но это больше основанный на перезапуске с контрольной точки.
Вдоль линий перезапуска с контрольной точки, оба OpenMPI и MPICH2 имеет поддержку BLCR , прозрачной формы отказоустойчивости перезапуска контрольной точки, которая позволяет легко откатиться до последней контрольной точки в случае аппаратного или сетевого сбоя.