slurm: Как я могу предотвратить удаление информации о работе? - PullRequest
0 голосов
/ 01 мая 2018

Используя sacct Я хочу получить информацию о моих выполненных заданиях.

Ответ упоминает, как мы можем получить информацию о работе.

Я отправил имя работы jobName.sh, у которого jobID 176. После 12 часов и новых 200 рабочих мест я хочу проверить информацию о моей работе (jobID = 176) и получить slurm_load_jobs error: Invalid job id specified.

scontrol show job 176
slurm_load_jobs error: Invalid job id specified

А следующая строка ничего не возвращает: sacct --name jobName.sh

Я полагаю, что для сохранения ранее отправленной информации о задании существует определенный срок, когда каким-либо образом информация о предыдущих работах была удалена. Есть ли предел для этого? Как я могу сделать это ограничение очень большим значением, чтобы предотвратить их удаление?

Обратите внимание, что JobRequeue=0 находится на slurm.conf.

Ответы [ 2 ]

0 голосов
/ 02 мая 2018

Вкл. Документация по слерму упоминается, что:

MinJobAge Минимальный возраст завершенной работы до ее записи очищено от активной базы данных Slurm. Установите значения MaxJobCount и чтобы демон slurmctld не исчерпал свою память или другие Ресурсы. Значение по умолчанию составляет 300 секунд. Нулевое значение предотвращает очистка любой записи о работе. Для того, чтобы устранить некоторые возможные расы условия, минимальное ненулевое значение для MinJobAge рекомендуется 2.

В моем slurm.conf файле MinJobAge было 300, что составляет 5 минут. Поэтому через 5 минут информация о каждом выполненном задании была удалена. Я увеличил значение MinJobAge, чтобы предотвратить операцию удаления.

0 голосов
/ 02 мая 2018

Предполагая, что вы используете mySQL для хранения этих данных, в файле конфигурации базы данных slurmdbd.conf вы можете, среди прочего, настроить время очистки. Вот несколько примеров:

PurgeJobAfter=12hours
PurgeJobAfter=1month
PurgeJobAfter=24months

Если не задано (по умолчанию), то записи заданий никогда не удаляются.

Подробнее info .

...