Когда я отправляю SBATCH
задание нашему HPC
, я полагаю, что slurm распределяет узлы на основе ресурсов, и в моем случае Хост всегда вызывается на Node 0 , который установлен как1-й в алфавитном порядке node/machine
имен. Это вызывает проблемы, потому что (иногда) на этом хост-узле может работать только 1 ядро (и, следовательно, небольшой объем памяти), что означает, что он не может записывать большие файлы результатов / данных, которые мне нужны.
Есть ли какой-нибудь способ установить узел хоста вручную, учитывая, что в моем nodefile
? 1009 * * 1010 выделен слерм ресурсов. Я мог бы исправить это с помощью - mincpus
, но мне нужно только> 1 процессордля этой цели. Другие решения, увеличивающие --mem-per-cpu
или просто --mem
, также просто добавляют больше ресурсов в задание и задерживают его запуск.