Есть хороший вопрос ( Узнать использование времени ЦП и памяти заданием slurm ) о том, как получить время ЦП и использование памяти заданием slurm и раскруткой, есть хороший ответ ({ ссылка }). Однако, если я правильно понимаю, seff <job id>
возвращает Memory Efficiency
, что соответствует MAXRSS на протяжении всего срока выполнения задания.
Как мне получить временные ряды использования памяти (и, возможно, ЦП)?
Я хотел бы понять, почему у моих заданий slurm заканчивается память после 6+ часов нормальной работы.