При планировании пакетного задания в SLURM, например,
sbatch -N 10 batch-script.sh
#!/bin/bash
#SBATCH --job-name=jobname
srun --label /usr/bin/hostname
, можно проверить, какой шаг выполняется в данный момент, с помощью sacct
:
JobID JobName Partition Account AllocCPUS State ExitCode
------------ ---------- ---------- ---------- ---------- ---------- --------
...
421.1 hostname test 10 RUNNING 0:0
Но какМожно ли проверить, какие задачи / узлы все еще выполняются на текущем шаге, а какие завершены? (В этом случае на каждый узел приходится только 1 задача.) Единственная опция, которую я нашел в документации, - это установить команду --task-epilog
и что-то записывать, когда каждая задача выполнена.
Было бы здорово увидеть,например, что 8 из 10 узлов завершили свою задачу, а node03
и node08
все еще работают.