У кого-нибудь есть опыт работы с кластерами, работающими на ClusterVisionOS? - PullRequest
0 голосов
/ 11 марта 2010

В настоящее время я работаю над кластером, использующим ClusterVisionOS 3.1. Это будет моя первая работа с кластером, поэтому я, вероятно, не пробовал «очевидное».

Я могу отправить одно задание в кластер с помощью команды "qsub" (это у меня правильно работает)

Но проблема начинается при отправке нескольких заданий одновременно. Я мог бы написать сценарий, посылая их все сразу, но тогда все узлы были бы заняты моей работой, и здесь было бы больше людей, желающих отправить свою работу.

Так вот сделка:

32 узла (по 4 процессора / слота в каждом)

Лучше всего было бы указать кластеру использовать 3 узла (12 процессоров) и поставить все мои задания на эти узлы / процессоры в очередь, если это вообще возможно. Если бы я мог позволить узлам использовать 1 процессор для каждой работы, то это было бы идеально.

1 Ответ

0 голосов
/ 30 марта 2010

Хорошо, так что, думаю, я узнал, что нет решения этой проблемы. Мое личное решение - написать скрипт, который через ssh соединяется с кластером, а затем просто позволить скрипту проверить, сколько заданий уже запущено под вашим именем пользователя. Скрипт проверяет, не превышает ли это число, скажем, 20 заданий одновременно. Пока это число не достигнуто, оно продолжает отправлять задания.

Возможно, это уродливое решение, но рабочее!

Что касается процессора, задания уже были отправлены на разные процессоры, полностью используя все узлы.

...