Изменение ControlPort в развертывании слерма в Google Cloud - PullRequest
0 голосов
/ 18 марта 2019

У меня проблемы с кластером slurm, который я развернул на облачной платформе Google.В моем файле slurmctld.log я получаю эту ошибку:

ошибка: slurm_persist_conn_open_without_init: не удалось открыть постоянное соединение с google-gcp-controller: 6819: соединение отклонено

Поэтому я посмотрел на sacctmgr list cluster WOLimits

Cluster ControlHost ControlPort RPC


google-gcp 10.10.0.2 6817 8192

ControlPort не работаетt совпадение между ошибкой и выводом sacctmgr.Это то, почему мои работы терпят неудачу?Как я могу решить эту проблему?

1 Ответ

0 голосов
/ 29 марта 2019

6819 - порт хранения учета; slurmdbd демон должен прослушивать этот порт. Так что, скорее всего, этот демон не запущен или даже не настроен. См. документацию для получения дополнительной информации.

...