OpenMPI 1.4.3 mpirun ошибка файла хоста - PullRequest
5 голосов
/ 09 июля 2011

Я пытаюсь запустить простую программу MPI на 4 узлах. Я использую OpenMPI 1.4.3 на Centos 5.5. Когда я отправляю команду MPIRUN с hostfile / machinefile, я не получаю вывод, получаю пустой экран. Следовательно, Я должен убить работу. .

Я использую следующую команду запуска:: mpirun --hostfile hostfile -np 4 new46

 OUTPUT ON KILLING JOB:
 mpirun: killing job...
 --------------------------------------------------------------------------
  mpirun noticed that the job aborted, but has no info as to the process that caused 
  that situation.
  --------------------------------------------------------------------------
  mpirun was unable to cleanly terminate the daemons on the nodes shown
   below. Additional manual cleanup may be required - please refer to
   the "orte-clean" tool for assistance.
   --------------------------------------------------------------------------
    myocyte46 - daemon did not report back when launched
    myocyte47 - daemon did not report back when launched
    myocyte49 - daemon did not report back when launched

Вот программа MPI, которую я пытаюсь выполнить на 4 узлах

   **************************

   if (my_rank != 0)
   {
    sprintf(message, "Greetings from the process %d!", my_rank);
    dest = 0;
    MPI_Send(message, strlen(message)+1, MPI_CHAR, dest, tag, MPI_COMM_WORLD);
   }
   else
   {
   for (source = 1;source < p; source++)
   {
    MPI_Recv(message, 100, MPI_CHAR, source, tag, MPI_COMM_WORLD, &status);
    printf("%s\n", message);
   }

   ****************************

Мой файл хоста выглядит так:

   [amohan@myocyte48 ~]$ cat hostfile
   myocyte46
   myocyte47
   myocyte48
   myocyte49
   *******************************

Я запускал вышеупомянутую программу MPI независимо на каждом из узлов, и она компилировалась и работала просто отлично. У меня есть проблема " Daemon не сообщал, когда запускается ", когда я использую файл хоста Я пытаюсь выяснить, в чем может быть проблема.

Спасибо!

1 Ответ

1 голос
/ 09 июля 2011

Я думаю, что эти строки

myocyte46 - daemon did not report back when launched

довольно ясно - у вас проблемы либо с запуском демонов mpi, либо после связи с ними Так что вам нужно начать смотреть на сети. Можете ли вы ssh без пароля в эти узлы? Ты можешь вернуться? Оставляя в стороне программу MPI, вы можете

mpirun -np 4 hostname

и получить что-нибудь?

...