Slurm: как код задания достигает вычислительных узлов? - PullRequest
1 голос
/ 15 октября 2019

Я хочу понять, как код задания или приложение достигает выделенного компьютерного узла, используя --srun или даже узлы, если я использую MPI в slurm?

Я прочитал, что кластеры обычно имеют общие файловые системы. Означает ли это, что узлы просто получают код для задания из общей файловой системы или узлы взаимодействуют друг с другом напрямую?

К сожалению, я не нашел информации об этом в документации Slurm.

1 Ответ

0 голосов
/ 18 октября 2019

Slurm сделает предположение, что пути к необходимым файлам (код, а также файлы конфигурации и данные) доступны одинаково для всех вычислительных узлов.

Как правило, кластероснащен сетевой файловой системой (например, NFS), которая монтируется на всех узлах входа и вычисления. Часто это домашний каталог пользователей, то есть каталог, в который пользователь «помещается» при подключении. Он предназначен для кода, исполняемых файлов и небольших файлов.

Кластеры также часто предлагают другую файловую систему, параллельную файловую систему (например, Luster, BeeGFS и т. Д.), Которая также монтируется на всех вычислительных узлах. Зачастую параллельная файловая система быстрее сетевой файловой системы, но она менее «безопасна»;без резервных копий, без снимков и т. д. Он предназначен для временных данных.

...