Мне нужно сохранить значения градиента функции потерь w.r.t. Параметры модели для каждого образца обучения в процессе обучения. Это может быть в форме матрицы формы batch_size * num_params. Есть ли способ сохранить эти значения на каждой итерации после каждого обратного распространения?