Правильный запуск скрипта Slurm с большим количеством узлов и меньшим количеством ядер - PullRequest
0 голосов
/ 25 апреля 2018

Каждый отдельный узел hpc имеет максимально возможное количество ядер, равное 24, но они не всегда все доступны, поэтому я хотел бы запустить код на 4 узлах с 20 ядрами на каждом (вместо 24).

Правильно ли это с использованием MPI?

#!/bin/sh
#
# Replace <ACCOUNT> with your account name before submitting.
#
#SBATCH --account=aaa            # The account name for the job.
#SBATCH --job-name=job_name      # The job name.
#SBATCH -N 4                     # The number of nodes to use
                                 # (note there are 24 cores per node)
#SBATCH --exclusive
#SBATCH --time=23:58:00          # The time the job will take to run.

source activate env_python
mpirun -n 80 python script.py

# End of script

1 Ответ

0 голосов
/ 26 апреля 2018

Это будет делать то, что вы хотите:

#!/bin/sh
#
# Replace <ACCOUNT> with your account name before submitting.
#
#SBATCH --account=aaa            # The account name for the job.
#SBATCH --job-name=job_name      # The job name.
#SBATCH -N 4                     # The number of nodes to use
                                 # (note there are 24 cores per node)
#SBATCH --tasks-per-node=20
#SBATCH --time=23:58:00          # The time the job will take to run.

source activate env_python
mpirun -n 80 python script.py

# End of script

Запрос 4 узлов по 20 задач в каждом, которые будут сопоставлены с 80 рангами MPI. -n 80 тогда не требуется.

...