У меня есть l1 activity_regularizer = l1 в последнем слое моей генеративной нейронной сети:
outputs = Dense(200, activation='softmax', activity_regularizer=l1(1e-5))(x)
Это улучшает мои результаты, но я не понимаю, почему это что-то изменит для активации softmax.Сумма выходов = 1, причем все положительные значения всегда, поэтому регуляризатор должен давать точно такие же потери, несмотря ни на что
Что activity_regularizer=l1(1e-5)
делает на моих тренировках?