Создание многоузлового кластера HPC - PullRequest
1 голос
/ 06 мая 2019

У меня есть кластер HPC, в котором несколько веб-приложений установлены в Docker-контейнерах, очередь управляется с помощью Torque.Каждое приложение отправляет задание в кластер HPC, подключаясь к нему через ssh и затем запуская qsub: ssh user@cluster qsub bla blabla.Есть общая папка для обмена данными.

Я не удовлетворен этой настройкой, и я хотел бы знать, возможно ли иметь мастер-узел, работающий на каждом докере и использующий qsub непосредственно внутри него, не делая sshподключение.Я бы предпочел использовать крутящий момент, но я открыт для других решений.

1 Ответ

1 голос
/ 14 мая 2019

Крутящий момент разрешает несколько хостов представления.

Имена или адреса хостов должны быть добавлены в переменную submit_hosts в конфигурации сервера Torque, вот соответствующая страница из руководства.

qmgr -c 'set server submit_hosts = headnode'
qmgr -c 'set server submit_hosts += app1'
qmgr -c 'set server submit_hosts += app2'

Предполагая, app1 и app2 являются доменными именами контейнеров Docker. Вам нужно будет настроить разрешение имен.

Для получения более подробной информации и других опций см. Руководство по крутящему моменту .

...