Мне нужно создать собственный оптимизатор в керасе, в чем смысл следующих команд. Вывод - это матрица или массив?
shapes = [K.int_shape(p) for p in params]
grads_w = [K.zeros(shape) for shape in shapes]
Аналогичный вопрос был Объяснение SGD в функциональности keras . Как и в предыдущем вопросе, мне интересно, почему (и если я прав) на каждой итерации инициализирует m до 0
for p, g, m in zip(params, grads, moments):
v = self.momentum * m - lr * g # velocity
self.updates.append(K.update(m, v))