Каков лучший прогресс Hydra MPI - PullRequest
6 голосов
/ 23 мая 2011

Я изучаю новый диспетчер процессов, который поставляется автоматически с MPICH2, но до сих пор я не могу понять, что является значительным преимуществом этой реализации, кто-то знает хороший учебник или имеет опыт работы с ним?
Аргоннская вики является своего рода слишком простым: http://wiki.mcs.anl.gov/mpich2/index.php/Using_the_Hydra_Process_Manager

Ответы [ 2 ]

9 голосов
/ 23 мая 2011

С точки зрения того, где я работаю, самое большое преимущество - это масштабируемость запуска процесса. Запуск 8000+ заданий задач с предыдущими программами запуска процессов в реализациях MPI на основе MPICH2 был необычайно медленным и часто приводил к сбою из-за тайм-аутов или других проблем в сети, которые почти исключали MPI на основе MPICH2 для наших самых крупных заданий. Но у Hydra есть хорошая иерархическая модель запуска, которая также может использовать преимущества вашего менеджера ресурсов.

Стратегии распределения с учетом топологии тоже хороши, но по сравнению с разницей между ошибками запуска заданий (или занятием нескольких часов) и последующими заданиями, это эффект второго порядка.

5 голосов
/ 23 мая 2011

Я полностью согласен с Джонатаном в существенном улучшении времени запуска работы. Кроме того, Hydra, как правило, гораздо полезнее и надежнее, чем предыдущие менеджеры процессов, практически во всех аспектах. Он запускается более надежно, имеет больше функций (привязка к ядру процесса, перенаправление выходного файла на основе формата, интеграция диспетчера ресурсов и планировщика пакетов и т. Д.) И содержит меньше загадочных сообщений об ошибках, чем все предыдущие менеджеры процессов для MPICH2.

Другое ключевое соображение заключается в том, что гидра активно поддерживается, в то время как почти все другие PM устарели и / или не поддерживаются в этой точке. Поэтому, если вы сообщите об ошибке в гидре, она, скорее всего, будет исправлена, что неверно для MPD или remshell.

AFAIK, вы также можете использовать Hydra для запуска заданий не MPI, таких как программы UPC, если вы знаете, что делаете.

...