Я пытаюсь построить простой кластер на основе Windows XP. Я успешно скомпилировал OpenMPI-1.4.2, и такие инструменты, как mpicc
и ompi_info
тоже работают, но я не могу заставить мой mpirun
работать должным образом. Единственный вывод, который я вижу, это
Z:\>orterun --hostfile z:\hosts.txt -np 2 hostname
[host0:04728] Failed to initialize COM library. Error code = -2147417850
[host0:04728] [[8946,0],0] ORTE_ERROR_LOG: Error in file ..\..\openmpi-1.4.2
\orte\mca\ess\hnp\ess_hnp_module.c at line 218
--------------------------------------------------------------------------
It looks like orte_init failed for some reason; your parallel process is
likely to abort. There are many reasons that a parallel process can
fail during orte_init; some of which are due to configuration or
environment problems. This failure appears to be an internal failure;
here's some additional information (which may only be relevant to an
Open MPI developer):
orte_plm_init failed
--> Returned value Error (-1) instead of ORTE_SUCCESS
--------------------------------------------------------------------------
[host0:04728] [[8946,0],0] ORTE_ERROR_LOG: Error in file ..\..\openmpi-1.4.2
\orte\runtime\orte_init.c at line 132
--------------------------------------------------------------------------
It looks like orte_init failed for some reason; your parallel process is
likely to abort. There are many reasons that a parallel process can
fail during orte_init; some of which are due to configuration or
environment problems. This failure appears to be an internal failure;
here's some additional information (which may only be relevant to an
Open MPI developer):
orte_ess_set_name failed
--> Returned value Error (-1) instead of ORTE_SUCCESS
--------------------------------------------------------------------------
[host0:04728] [[8946,0],0] ORTE_ERROR_LOG: Error in file ..\..\..\..\openmpi
-1.4.2\orte\tools\orterun\orterun.c at line 543
Где z:\hosts.txt
выглядит следующим образом:
host0
host1
Z:
- это сетевой сетевой диск, доступный как для host0, так и для host1.
В чем моя проблема и как ее исправить?
Upd:
Хорошо, эта проблема, кажется, исправлена. Мне кажется, что драйвер WideCap и / или программные компоненты вызывают эту ошибку. «Чистый» компьютер успешно выполняет локальное задание. В любом случае, я все еще не могу запустить задачу как минимум на двух машинах, я получаю следующее сообщение:
Z:\>mpirun --hostfile z:\hosts.txt -np 2 hostname
connecting to host1
username:MAIN\cluster
password:********
Save Credential?(Y/N) y
[host0:04728] This feature hasn't been implemented yet.
[host0:04728] Could not connect to namespace cimv2 on node host1. Error code =-2147217400
--------------------------------------------------------------------------
mpirun was unable to start the specified application as it encountered an error.
More information may be available above.
--------------------------------------------------------------------------
Я немного погуглил и сделал все, как описано здесь: http://www.open -mpi.org / community / lists / users / 2010/03 / 12355.php но я все еще получаю та же ошибка. Кто-нибудь может мне помочь?
UPD2:
Код ошибки -2147217400 может быть ошибкой WMI WBEM_E_INVALID_PARAMETER (0x80041008)
, которая возникает, когда один из параметров, переданных в вызов WMI, неверен. Значит ли это, что проблема в самом исходном коде OpenMPI? Или, может быть, это из-за неправильных / устаревших wincred.h
и credui.lib
, которые я использовал при сборке OpenMPI из исходного кода?