Измените количество ядер, которые OpenMPI может «увидеть» - PullRequest
0 голосов
/ 03 июня 2019

Я запускаю исполняемый файл (у меня нет доступа к исходному коду), который вызывает mpirun. Я получаю следующую ошибку, которая часто встречается, если запрашивается больше ядер, чем доступно на ЦП:

There are not enough slots available in the system to satisfy the 12
slots that were requested by the application:

  /Users/me/Library/app/executable

Either request fewer slots for your application, or make more slots
available for use.

A "slot" is the Open MPI term for an allocatable unit where we can
launch a process.  The number of slots available are defined by the
environment in which Open MPI processes are run:

  1. Hostfile, via "slots=N" clauses (N defaults to number of
     processor cores if not provided)
  2. The --host command line parameter, via a ":N" suffix on the
     hostname (N defaults to 1 if not provided)
  3. Resource manager (e.g., SLURM, PBS/Torque, LSF, etc.)
  4. If none of a hostfile, the --host command line parameter, or an
     RM is present, Open MPI defaults to the number of processor cores

In all the above cases, if you want Open MPI to default to the number
of hardware threads instead of the number of processor cores, use the
--use-hwthread-cpus option.

Alternatively, you can use the --oversubscribe option to ignore the
number of available slots when deciding the number of processes to
launch.

Моя проблема в том, что я не могу изменить параметры командной строки для mpirun, например. используя --oversubscribe. Скорее, мне нужно изменить количество ядер по умолчанию, которое OpenMPI «видит». (Это было бы легко исправить в противном случае, как в в этом случае )

Существует ли переменная окружения или что-то, что я могу обновить, чтобы заставить openMPI работать?

1 Ответ

0 голосов
/ 03 июня 2019

Ах.Я нашел хост-файл OpenMPI по умолчанию в /usr/local/etc/openmpi-default-hostfile (на Mac) и добавил в конце (в новой строке):

localhost slots=12

Так что OpenMPI считывал значение по умолчанию slotsколичество 6, так как в моей системе 6 ядер (ошибка произошла только для> 6 запрошенных процессоров).Но у меня 12 потоков, и я хотел использовать процессор на полную мощность.

Это сработало для меня, так как я не запускал mpirun в командной строке.

...