Есть ли выходной журнал / каталог для сообщений об ошибках sbatch? - PullRequest
0 голосов
/ 14 января 2020

Я запускаю скрипт sbatch, и он успешно отправляется.

sbatch sbatch_script.sh

Submitted batch job 309376

Но он не отображается, когда я запускаю squeue -u <my_username>, и выход не генерируется.

Есть ли способ проверить, что пошло не так? Например, я могу проверить некоторые переменные окружения / журнал вывода?

1 Ответ

0 голосов
/ 14 января 2020

вывод sbatch записывается в slurm_{job_id}.out на узле. Вместо этого вы можете вручную указать выходной файл в локальном каталоге (просто выполните myfile.out). Затем этот файл появится прямо в локальном каталоге и будет содержать стандартную ошибку и выходные потоки.

Мой пакетный файл:

#!/bin/bash
#SBATCH --gres=gpu:1
#SBATCH --mem=12G
#SBATCH -p gpu
#SBATCH -c 8
#SBATCH -n 1
#SBATCH -o myfile.out
source ~/anaconda3/bin/activate acl2020
python  main.py --various args 

...