Slurm можно настроить так, чтобы задания ограничивались запросами ресурсов (наиболее обычная настройка), чего, похоже, нет в используемом вами кластере.
Если бы это было так, ваш задание будет уничтожено при попытке использовать больше памяти, чем запрошено, и оно будет ограничено запрошенными вами физическими процессорами.
В вашем случае использование большего количества памяти, чем запрошено, может привести к исчерпанию памяти на узле, на котором ваше задание выполняется, возможно, ваши процессы (но также, возможно, процессы других заданий на том же узле!) были убиты убийцей OOM . Использование большего количества ЦП, чем запрошено, означает, что процессы, запущенные вашим заданием, будут конкурировать с процессами других заданий для того же физического ЦП, что приведет к общему замедлению всех заданий на узле из-за большого количества переключений контекста . Задания, которые замедляются, могут превысить максимальное время и быть убиты.
Таким образом, недооценка ресурсов может привести к потере ваших рабочих мест. Если узлы используются совместно несколькими заданиями, это также может привести к потере заданий другими пользователями.