обработчики ошибок в MPICH и OpenMPI - PullRequest
0 голосов
/ 26 апреля 2011

есть ли обработчики ошибок, реализованные в OpenMPI и MPICH, кроме MPI_ERROR_RETURN и MPI_ERRORS_ARE_FATAL? какая реализация лучше в обработке ошибок? Просьба предложить ссылку для получения дополнительной информации о том же ..

1 Ответ

1 голос
/ 26 апреля 2011

Нет, это только два обработчика ошибок, определенных стандартом в настоящее время.

Форум MPI в настоящее время работает над тем, что станет MPI-3, и обработкой ошибок и отказоустойчивостью.станет важным компонентом нового стандарта (есть рабочая группа , посвященная этой теме).Однако до тех пор, пока эта работа не будет завершена, единственный способ повысить отказоустойчивость MPI - это использовать более ранние, нестандартные расширения. FT-MPI - проект, который разработал очень надежный MPI, но, к сожалению, он основан на MPI1.2;очень ранняя версия стандарта.Есть MPICH-V , основанный на MPI2, но это больше основанный на перезапуске с контрольной точки.

Вдоль линий перезапуска с контрольной точки, оба OpenMPI и MPICH2 имеет поддержку BLCR , прозрачной формы отказоустойчивости перезапуска контрольной точки, которая позволяет легко откатиться до последней контрольной точки в случае аппаратного или сетевого сбоя.

...