Есть ли способ сделать краткий отчет о задании на печать после завершения? - PullRequest
0 голосов
/ 20 апреля 2020

Я хотел бы, чтобы информация о задании на печать SLURM равнялась stdout или stderr после завершения / завершения задания.

Я хотел бы получить что-то вроде этого (это было из предыдущего кластера, на котором я работал, с LSF):

------------------------------------------------------------
Sender: LSF System <xxx@xxx>
Subject: Job 2273357[201]: <TG.wg.window[1-779]%100> in cluster <farm> Exited

Job <TG.wg.window[1-779]%100> was submitted from host <farm-headnode> by user <username> in cluster <farm>.
Job was executed on host(s) <2*host_01>, in queue <normal>, as user <username> in cluster <farm>.
</home/username> was used as the home directory.
</my/working/directory> was used as the working directory.
Started at Sat Jan 28 01:00:22 2017
Results reported on Sat Jan 28 01:02:28 2017

Your job looked like:

------------------------------------------------------------
# LSBATCH: User input
./tmp.616856.exe $LSB_JOBINDEX
------------------------------------------------------------

Exited with exit code 1.

Resource usage summary:

    CPU time :                                   112.44 sec.
    Max Memory :                                 25 MB
    Average Memory :                             20.38 MB
    Total Requested Memory :                     1000.00 MB
    Delta Memory :                               975.00 MB
    Max Swap :                                   264 MB
    Max Processes :                              15
    Max Threads :                                15

В настоящее время мой кластер SLURM имеет следующее поведение:

  • когда я запускаю задание через srun, я получаю код выхода, сообщение об успешном завершении или сообщение об ошибке, если задание было прервано самой Slurm по причинам ресурса
  • , когда я запустите задание через sbatch -e errfile -o outfile --wrap="command", файл ошибок и выходной файл будут пустыми, если command сам не записывает в stdout / err. В частности, если command завершается с кодом выхода, в файлах нет никаких следов.

Я знаю, что могу сделать scontrol show job [jobid], но информация о работе сохраняется только пару часов. Я видел предложения написать скрипт-обертку, который по сути запускал бы эту команду после завершения задания, но в идеале я не хочу писать сложный скрипт-обертку или планировать больше заданий. Я ищу параметр конфигурации, который бы выводил информацию о задании в stderr / out или в файл.

TIA

Отказ от ответственности: я пользователь этого кластера, а не администратор. Просто пытаюсь выяснить, возможно ли это, и передать необходимые изменения конфигурации моему системному администратору.

...