У меня проблемы с кластером slurm, который я развернул на облачной платформе Google.В моем файле slurmctld.log я получаю эту ошибку:
ошибка: slurm_persist_conn_open_without_init: не удалось открыть постоянное соединение с google-gcp-controller: 6819: соединение отклонено
Поэтому я посмотрел на sacctmgr list cluster WOLimits
Cluster ControlHost ControlPort RPC
google-gcp 10.10.0.2 6817 8192
ControlPort не работаетt совпадение между ошибкой и выводом sacctmgr.Это то, почему мои работы терпят неудачу?Как я могу решить эту проблему?