Есть ли способ выбрать лучшее значение grad_norm (), посмотрев на скрытые веса? Поскольку попытка найти другое значение занимает много времени, мне было интересно, знает ли кто-нибудь это и поделится ли здесь своими знаниями.