Как перезапустить сбойное задание PBS в кластере (qsub)? - PullRequest
0 голосов
/ 13 декабря 2018

Я запускаю задание PBS (python) в кластере с помощью команды qsub .Мне любопытно узнать, как я могу перезапустить ту же работу с того места, где она не удалась?Любая помощь будет высоко оценена.

1 Ответ

0 голосов
/ 31 января 2019

Скорее всего, вы не можете.

Для перезапуска задания требуется файл контрольных точек.
Для этого необходимо явно настроить поддержку контрольных точек в вашей среде HPC, а затем задание должно быть отправлено с дополнительнымиаргументы командной строки.

См. http://docs.adaptivecomputing.com/torque/3-0-5/2.6jobcheckpoint.php

...