Используя Slurm, можно запросить определенное количество ядер на узле. Например, #SBATCH -N 1 -n 8
запрашивает 8 ядер на одном узле. Следуя этой логике c, #SBATCH -N 10 -n 16
запрашивает 16 ядер, разделенных на 10 вычислительных узлов (всего 16 ядер). Я также могу указать, какие узлы следует использовать, например, #SBATCH -N 2 -n 4 -w node2, node3
будет запрашивать 4 ядра на узлах с именами node2
и node3
.
Пока все хорошо. Но я бы хотел
- Указать используемые узлы (
-w
флаг) - И указать, сколько ядер нужно запрашивать на каждом узле
Во-вторых, я не могу использовать флаг -n
, так как он не позволяет размещать запрошенные ядра на указанных c узлах. Однако в моем случае указание ядер на узел необходимо, так как неудачное распределение процессов на одном узле (например, 20 процессоров на узле 2 вместо 10 процессоров на каждом узле 2 и узле 3) потребовало бы слишком много памяти на узле и процессах. в конечном итоге сломается.
Есть предложения?