У меня есть код, который вычисляет Softmax с течением времени, но я не могу понять строку.Кто-нибудь может мне объяснить?
def softmax_over_time(x):
assert(K.ndim(x) > 2)
e = K.exp(x - K.max(x, axis=1, keepdims=True))
s = K.sum(e, axis=1, keepdims=True)
return e / s
Кто-нибудь может объяснить мне, почему мы используем "x - K.max (x, axis = 1, keepdims = True)"?Я думаю, что истина должна быть "K.max (x, axis = 1, keepdims = True)"?