Я новичок, пытающийся установить / администрировать slurm.Я хочу ограничить количество разветвлений, которые может выполнять работа с грязью.Я использовал команду стресса, чтобы увидеть загрузку ЦП по slurm.
Когда я запускаю этот пакетный скрипт
#SBATCH -p Test -c 1
stress -c 1
Задание работает нормально с одним ядром, использованным на 100 процентов.Но этот скрипт
#SBATCH -p Test -c 1
stress -c 20
также выполняется, но команда top дает список из 20PID, разветвленных с использованием ЦП, по 5 процентов каждый.Это имеет смысл, поскольку общее использование составляет 1 процессорное ядро на 100 процентов.Это сводит с ума средние нагрузки, которые, как я узнал, прибегая к помощи Google, не дают правильного представления о загрузке системы.У меня есть 2 вопроса
Можно ли в slurm ограничить такое поведение из конфигурации администратора, убив второй запуск.Мои различные попытки пока ничего не дали.Slurm настроен с помощью cgroup и прекрасно убивает задания памяти.MPI не используется или не настроен.
Это поведение вызывает неэффективность из-за времени ожидания процесса?
Я попытался установить эти радикальные параметры, чтобы проверить, что происходит.
MaxStepCount = 1 MaxTasksPerNode = 2
Но на удивление ничего не происходит, и я могу отправитьмного больше рабочих мест после этого.