Центральный менеджер Кондор не мог видеть другие вычислительные узлы - PullRequest
1 голос
/ 12 февраля 2012

Я соединяю три сервера, чтобы сформировать кластер HPC, используя condor в качестве промежуточного программного обеспечения, когда я запускаю команду condor_status из центрального менеджера, она не показывает другие узлы, на которых я могу запускать задания в центральном менеджере и подключаться к другим узлам через SSH но, похоже, чего-то не хватает в файлах конфигурации кондора, где я устанавливаю центральный менеджер в качестве хоста кондора и позволяет писать и читать всем. Я храню демон MASTER, STARTD в списке демонов для рабочих узлов.

Когда я запускаю condor_status в центральном менеджере, он просто показывает центральный менеджер, а когда я запускаю его на вычислительном узле, он выдает мне сообщение «CEDAR: 6001: Не удалось подключиться», за которым следуют IP-адрес центрального центра и номер порта .

Ответы [ 3 ]

1 голос
/ 13 февраля 2012

Мне удается это решить.Проблема была в брандмауэре центрального менеджера (в моем случае это был iptables), который работал.Итак, когда я остановил брандмауэр (su -c «остановка службы iptables»), все узлы появились нормально, набрав condor_status ".

Состояние брандмауэра можно проверить с помощью« Состояние службы iptables ».

0 голосов
/ 17 января 2017

В моем случае служба "condor.exe" не работала на сервере.Я остановился вручную.Я только начинаю, и все идет хорошо.

0 голосов
/ 13 февраля 2012

Есть много вещей, которые могут происходить здесь.Я бы посоветовал вам следовать этому руководству и посмотреть, решит ли оно ваши проблемы -

http://spinningmatt.wordpress.com/2011/06/12/getting-started-creating-a-multiple-node-condor-pool/

...