Я хотел бы, чтобы информация о задании на печать SLURM равнялась stdout
или stderr
после завершения / завершения задания.
Я хотел бы получить что-то вроде этого (это было из предыдущего кластера, на котором я работал, с LSF):
------------------------------------------------------------
Sender: LSF System <xxx@xxx>
Subject: Job 2273357[201]: <TG.wg.window[1-779]%100> in cluster <farm> Exited
Job <TG.wg.window[1-779]%100> was submitted from host <farm-headnode> by user <username> in cluster <farm>.
Job was executed on host(s) <2*host_01>, in queue <normal>, as user <username> in cluster <farm>.
</home/username> was used as the home directory.
</my/working/directory> was used as the working directory.
Started at Sat Jan 28 01:00:22 2017
Results reported on Sat Jan 28 01:02:28 2017
Your job looked like:
------------------------------------------------------------
# LSBATCH: User input
./tmp.616856.exe $LSB_JOBINDEX
------------------------------------------------------------
Exited with exit code 1.
Resource usage summary:
CPU time : 112.44 sec.
Max Memory : 25 MB
Average Memory : 20.38 MB
Total Requested Memory : 1000.00 MB
Delta Memory : 975.00 MB
Max Swap : 264 MB
Max Processes : 15
Max Threads : 15
В настоящее время мой кластер SLURM имеет следующее поведение:
- когда я запускаю задание через srun, я получаю код выхода, сообщение об успешном завершении или сообщение об ошибке, если задание было прервано самой Slurm по причинам ресурса
- , когда я запустите задание через
sbatch -e errfile -o outfile --wrap="command"
, файл ошибок и выходной файл будут пустыми, если command
сам не записывает в stdout / err. В частности, если command
завершается с кодом выхода, в файлах нет никаких следов.
Я знаю, что могу сделать scontrol show job [jobid]
, но информация о работе сохраняется только пару часов. Я видел предложения написать скрипт-обертку, который по сути запускал бы эту команду после завершения задания, но в идеале я не хочу писать сложный скрипт-обертку или планировать больше заданий. Я ищу параметр конфигурации, который бы выводил информацию о задании в stderr / out или в файл.
TIA
Отказ от ответственности: я пользователь этого кластера, а не администратор. Просто пытаюсь выяснить, возможно ли это, и передать необходимые изменения конфигурации моему системному администратору.