qsub -t задание "умерло" - PullRequest
1 голос
/ 09 июля 2020

Я пытаюсь отправить задание массива в наш кластер с помощью qsub. Этот сценарий выглядит примерно так:

#!/bin/bash 
#PBS -l nodes=1:ppn=1              # Number of nodes and processor 
#.....  (Other options)
#PBS -t 0-50                       # List job

cd $PBS_O_WORKDIR
./programname << EOF
some parameters
EOF

Этот сценарий запускается без проблем при удалении опции -t. Но каждый раз, когда я добавлял -t, я получал следующий результат:

---------------------------------------------
Check nodes and clean them of stray processes
---------------------------------------------
Checking node XXXXXXXXXX
-> User XXXX  running job XXXXX.XXX:state=X:ncpus=X
-> Job XXX.XXX has died
Done clearing all the allocated nodes
------------------------------------------------------
Concluding PBS prologue script - XX-XX-XXXX XX:XX:XX
------------------------------------------------------
--------------  Job will be requeued  --------------

Где он умер и начал повторную очередь. Сообщение об ошибке отсутствует. Я не нашел в сети аналогичной проблемы. Кто-нибудь испытывал подобное раньше? Спасибо!

(Я написал еще один «ручной» скрипт qsub массива, который работает. Но я использую wi sh, чтобы получить работу, так как он находится в опции команды и намного чище.)

Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...