Я пытаюсь отправить задание массива в наш кластер с помощью qsub. Этот сценарий выглядит примерно так:
#!/bin/bash
#PBS -l nodes=1:ppn=1 # Number of nodes and processor
#..... (Other options)
#PBS -t 0-50 # List job
cd $PBS_O_WORKDIR
./programname << EOF
some parameters
EOF
Этот сценарий запускается без проблем при удалении опции -t
. Но каждый раз, когда я добавлял -t
, я получал следующий результат:
---------------------------------------------
Check nodes and clean them of stray processes
---------------------------------------------
Checking node XXXXXXXXXX
-> User XXXX running job XXXXX.XXX:state=X:ncpus=X
-> Job XXX.XXX has died
Done clearing all the allocated nodes
------------------------------------------------------
Concluding PBS prologue script - XX-XX-XXXX XX:XX:XX
------------------------------------------------------
-------------- Job will be requeued --------------
Где он умер и начал повторную очередь. Сообщение об ошибке отсутствует. Я не нашел в сети аналогичной проблемы. Кто-нибудь испытывал подобное раньше? Спасибо!
(Я написал еще один «ручной» скрипт qsub массива, который работает. Но я использую wi sh, чтобы получить работу, так как он находится в опции команды и намного чище.)