Я запускаю задание PBS (python) в кластере с помощью команды qsub .Мне любопытно узнать, как я могу перезапустить ту же работу с того места, где она не удалась?Любая помощь будет высоко оценена.
Скорее всего, вы не можете.
Для перезапуска задания требуется файл контрольных точек. Для этого необходимо явно настроить поддержку контрольных точек в вашей среде HPC, а затем задание должно быть отправлено с дополнительнымиаргументы командной строки.
См. http://docs.adaptivecomputing.com/torque/3-0-5/2.6jobcheckpoint.php