Slurm - размещение узла хоста? - PullRequest
0 голосов
/ 09 октября 2019

Когда я отправляю SBATCH задание нашему HPC, я полагаю, что slurm распределяет узлы на основе ресурсов, и в моем случае Хост всегда вызывается на Node 0 , который установлен как1-й в алфавитном порядке node/machine имен. Это вызывает проблемы, потому что (иногда) на этом хост-узле может работать только 1 ядро ​​(и, следовательно, небольшой объем памяти), что означает, что он не может записывать большие файлы результатов / данных, которые мне нужны.

Есть ли какой-нибудь способ установить узел хоста вручную, учитывая, что в моем nodefile? 1009 * * 1010 выделен слерм ресурсов. Я мог бы исправить это с помощью - mincpus, но мне нужно только> 1 процессордля этой цели. Другие решения, увеличивающие --mem-per-cpu или просто --mem, также просто добавляют больше ресурсов в задание и задерживают его запуск.

1 Ответ

0 голосов
/ 14 октября 2019

Вы можете использовать параметр --nodelist для установки определенных узлов, которые должны использоваться:

sbatch --nodelist=<NODE-NAME> script.sh

Или даже --exclude тех, которые вы не хотите использовать (например, узел 0):

sbatch --exclude=node0 script.sh

Официальная документация предоставляет дополнительную информацию об обоих вариантах.

...