У меня есть настройка, состоящая из 3 рабочих и узла управления, который я использую для отправки задач. Я хотел бы одновременно выполнить скрипт установки на всех рабочих:
bsub -q queue -n 3 -m 'h0 h1 h2' -J "%J_%I" mpirun setup.sh
Насколько я понимаю, я мог бы использовать ограничение ресурсов 'ptile' для принудительного выполнения на всех работниках:
bsub -q queue -n 3 -m 'h0 h1 h2' -J "%J_%I" -R 'span[ptile=1]' mpirun setup.sh
Однако иногда я сталкиваюсь с проблемой, что мой скрипт выполнялся несколько раз на одном и том же работнике.
Это ожидаемое поведение? Или в моей настройке есть ошибка? Есть ли лучший способ для принудительного выполнения нескольких рабочих?