Диспетчер кластеров HPC 2016: Как запустить задание на нескольких узлах? - PullRequest
0 голосов
/ 24 апреля 2019

Я новичок в HPC Cluster Manager, и, возможно, я не все делаю правильно, но вот моя проблема:

С самого начала я должен сказать, что у меня 2 узла: M-HEADNODE (группы: ComputeNodes, HeadNodes) и M-COMPUTENODE (группы: ComputeNodes). Они оба находятся в состоянии в сети и в норме

Я пытаюсь запустить некоторые скрипты Python с использованием заданий HPC, используя оба узла (M-HEADNODE, M-COMPUTENODE), но я продолжаю получать следующую ошибку для 2-го узла:

 Error from node:M-COMPUTENODE:System.Exception: Error when setting password for local account Administrator. Error code: 2245 at Microsoft.Hpc.NodeManager.RemotingExecutor.JobEntryFactory.<GetJobEntryAsync>d_4.MoveNext()
   --- End of stack trace from previous location where exception was thrown ---
   at System.Runtime.ExceptionServices.ExceptionDispatchInfo.Throw()
   at System.Runtime.CompulerServices.TaskAwaiter.HandleNonSuccessAndDebuggerNotification(Task task)
   at Microsoft.Hpc.NodeManager.RemotingExecutor.RemotingNMExecImpl.<StartJob>d_39.MoveNext()

Если я выполняю свою работу только на M-HEADNODE, задание заканчивается успешно. Я выбираю работающие узлы в разделе Выбор ресурса в окне нового задания.

Ошибка предполагает, что что-то не так с учетными данными M-COMPUTENODE, возможно, они не установлены или неверны. Однако я не знаю, нужно ли мне вводить некоторые учетные данные для узла и как это сделать, чтобы он работал. Есть предложения?

...