Я пытаюсь запустить один файл python 240 раз параллельно (поскольку запуск каждого отдельного файла занимает около 9 минут) в системе HP C. В идеале каждый файл python должен работать на одном ядре. На каждый узел приходится 24 ядра. Файл python принимает два входных файла, по одному из каждого набора:
CN_ONLY0.pdb
до CN_ONLY239.pdb
I_ONLY0.pdb
до I_ONLY239.pdb
.
Когда я запускаю указанный ниже код:
parallel="parallel --delay .2 \
-j $SLURM_NTASKS \
--joblog runtask.log \
--resume \
--max-args=2"
srun="srun --exclusive -N1 -n1 --cpus-per-task=1 --cpu-bind=cores"
find . -type f \( -name "CN_ONLY*.pdb" -o -name "I_ONLY*.pdb" \) |
sort -t Y -k 2 -g |
TMPDIR=$SLURM_SCRATCH \
$parallel python python_test.py
Программа Python выполняется правильно, но не распространяется на все запрошенные ЦП.
Кто-нибудь знает, как исправить эту проблему?