Запуск OpenMPI в Windows XP - PullRequest
1 голос
/ 25 мая 2010

Я пытаюсь построить простой кластер на основе Windows XP. Я успешно скомпилировал OpenMPI-1.4.2, и такие инструменты, как mpicc и ompi_info тоже работают, но я не могу заставить мой mpirun работать должным образом. Единственный вывод, который я вижу, это

Z:\>orterun --hostfile z:\hosts.txt -np 2 hostname
[host0:04728] Failed to initialize COM library. Error code = -2147417850
[host0:04728] [[8946,0],0] ORTE_ERROR_LOG: Error in file ..\..\openmpi-1.4.2
\orte\mca\ess\hnp\ess_hnp_module.c at line 218
--------------------------------------------------------------------------
It looks like orte_init failed for some reason; your parallel process is
likely to abort.  There are many reasons that a parallel process can
fail during orte_init; some of which are due to configuration or
environment problems.  This failure appears to be an internal failure;
here's some additional information (which may only be relevant to an
Open MPI developer):

  orte_plm_init failed
  --> Returned value Error (-1) instead of ORTE_SUCCESS
--------------------------------------------------------------------------
[host0:04728] [[8946,0],0] ORTE_ERROR_LOG: Error in file ..\..\openmpi-1.4.2
\orte\runtime\orte_init.c at line 132
--------------------------------------------------------------------------
It looks like orte_init failed for some reason; your parallel process is
likely to abort.  There are many reasons that a parallel process can
fail during orte_init; some of which are due to configuration or
environment problems.  This failure appears to be an internal failure;
here's some additional information (which may only be relevant to an
Open MPI developer):

  orte_ess_set_name failed
  --> Returned value Error (-1) instead of ORTE_SUCCESS
--------------------------------------------------------------------------
[host0:04728] [[8946,0],0] ORTE_ERROR_LOG: Error in file ..\..\..\..\openmpi
-1.4.2\orte\tools\orterun\orterun.c at line 543

Где z:\hosts.txt выглядит следующим образом:

host0
host1

Z: - это сетевой сетевой диск, доступный как для host0, так и для host1.

В чем моя проблема и как ее исправить?


Upd: Хорошо, эта проблема, кажется, исправлена. Мне кажется, что драйвер WideCap и / или программные компоненты вызывают эту ошибку. «Чистый» компьютер успешно выполняет локальное задание. В любом случае, я все еще не могу запустить задачу как минимум на двух машинах, я получаю следующее сообщение:

Z:\>mpirun --hostfile z:\hosts.txt -np 2 hostname
connecting to host1
username:MAIN\cluster
password:********
Save Credential?(Y/N) y
[host0:04728] This feature hasn't been implemented yet.
[host0:04728] Could not connect to namespace cimv2 on node host1. Error code =-2147217400
--------------------------------------------------------------------------
mpirun was unable to start the specified application as it encountered an error.
More information may be available above.
--------------------------------------------------------------------------

Я немного погуглил и сделал все, как описано здесь: http://www.open -mpi.org / community / lists / users / 2010/03 / 12355.php но я все еще получаю та же ошибка. Кто-нибудь может мне помочь?


UPD2: Код ошибки -2147217400 может быть ошибкой WMI WBEM_E_INVALID_PARAMETER (0x80041008), которая возникает, когда один из параметров, переданных в вызов WMI, неверен. Значит ли это, что проблема в самом исходном коде OpenMPI? Или, может быть, это из-за неправильных / устаревших wincred.h и credui.lib, которые я использовал при сборке OpenMPI из исходного кода?

...