SLURM: Должен ли быть отдельный gres.conf для каждого узла? - PullRequest
0 голосов
/ 05 марта 2020

При настройке кластера slurm вам необходимо иметь копию файла конфигурации slurm.conf на всех узлах. Эти копии идентичны. В ситуации, когда вам нужно использовать графические процессоры в вашем кластере, у вас есть дополнительный файл конфигурации, который вы должны иметь на всех узлах. Это gres.conf. Мой вопрос - будет ли этот файл отличаться на каждом узле в зависимости от конфигурации на этом узле, или он будет одинаковым на всех узлах (например, slurm.conf?). Предположим, что узлы имеют разные конфигурации gpus и не идентичны.

1 Ответ

1 голос
/ 05 марта 2020

Начиная с версии Slurm 14.3.0, gres.conf принимает параметр NodeName, так что один и тот же файл может быть настроен на всех узлах.

Из файла NEWS:

gres.conf - добавьте спецификацию NodeName, чтобы один файл gres.conf можно было использовать для гетерогенного кластера.

Таким образом, это будет выглядеть примерно так:

NodeName=node001 Name=gpu File=/dev/nvidia0
NodeName=node002 Name=gpu File=/dev/nvidia[0-1]
...

До этого файл gres.conf должен был отличаться для каждого узла.

...