SLURM: укажите количество ядер на узел - PullRequest
0 голосов
/ 01 марта 2020

Используя Slurm, можно запросить определенное количество ядер на узле. Например, #SBATCH -N 1 -n 8 запрашивает 8 ядер на одном узле. Следуя этой логике c, #SBATCH -N 10 -n 16 запрашивает 16 ядер, разделенных на 10 вычислительных узлов (всего 16 ядер). Я также могу указать, какие узлы следует использовать, например, #SBATCH -N 2 -n 4 -w node2, node3 будет запрашивать 4 ядра на узлах с именами node2 и node3.

Пока все хорошо. Но я бы хотел

  1. Указать используемые узлы (-w флаг)
  2. И указать, сколько ядер нужно запрашивать на каждом узле

Во-вторых, я не могу использовать флаг -n, так как он не позволяет размещать запрошенные ядра на указанных c узлах. Однако в моем случае указание ядер на узел необходимо, так как неудачное распределение процессов на одном узле (например, 20 процессоров на узле 2 вместо 10 процессоров на каждом узле 2 и узле 3) потребовало бы слишком много памяти на узле и процессах. в конечном итоге сломается.

Есть предложения?

...