Конфигурация настройки главного узла openMPI - PullRequest
2 голосов
/ 08 марта 2012

Я пытаюсь настроить относительно небольшой кластер (36 ядер) с openMPI, и у меня возникла небольшая проблема. У меня есть все библиотеки openMPI и все зависимости, установленные и работающие правильно (я могу запустить программу MPI hello world на каждом компьютере в качестве локального хоста). Проблема в том, что я не могу найти слишком много документации о том, как заставить компьютеры выполнять программу вместе. Я могу выполнить команду mpirun --hostfile, но мне не нужно указывать файл хоста каждый раз, когда я выполняю задание. Кроме того, будущие пользователи не будут иметь доступа ко всем IP-адресам в кластере постоянно. Они и я ожидаем, что сможем выполнить mpirun -np 20 programFile без проблем. Может ли кто-нибудь дать некоторые указания относительно того, что мне нужно сделать с этого момента? Справедливости ради, я взял только один класс в колледже, где мы писали параллельные программы с MPI, но они никогда не показывали нам, как НАСТРОИТЬ новый кластер с openMPI. Я ценю любой совет, который вы, ребята, можете дать. Я нашел это руководство в своих поисках MPICH_Cluster_Setup , что было бы здорово, если бы это был openMPI. Существует ли подобное руководство, касающееся openMPI?

1 Ответ

1 голос
/ 08 марта 2012

Вы должны использовать планировщик кластера, такой как Torque, SLURM или SGE (все бесплатны / FOSS).Это позволяет пользователям резервировать узлы для их использования, и все «общаются», чтобы открыть MPI, чтобы сообщить ему, какие узлы использовать для работы этих пользователей (чтобы им не приходилось использовать файл хоста).

Согласно документу по настройке кластера MPICH, это примерно то, что вам нужно для открытого MPI, но нет необходимости настраивать MPD в конце (MPICH, так или иначе, устарел MPD).

...