У меня есть кластер Debian с 2 узлами и двумя четырехъядерными процессорами каждый. Я использую Torque и Maui в качестве планировщика. Когда я пытаюсь запустить задание MPI с 16 процессами, планировщик не может запустить задание: либо помещает его в очередь (хотя в данный момент задание не выполняется), либо запускается, и в результате выходной файл сообщает, что Вы пытались запустить задание из 16 процессов только с 4 процессорами.
Файл
my ... / pbs / server_priv / node выглядит следующим образом:
node1 np=8
node2 np=8
и пример скрипта, который я использую для запуска программы, следующий:
#!/bin/sh
#PBS -d /home/bellman/
#PBS -N output
#PBS -k oe
#PBS -j oe
#PBS -l nodes=2:ppn=8,walltime=10000:00:00
#PBS -V
ulimit -s 536870912
# How many procs do I have?
NP=$(wc -l $PBS_NODEFILE | awk '{print $1}')
echo Number of processors is $NP
mpiexec -np 16 /home/bellman/AAA
Я перепробовал множество комбинаций узлов и ppn, но одна из двух ошибок произошла. Есть идеи о том, что происходит?