Делает это «поэлементно» в тензорах, для них оно принимает среднее значение по всей оси, кроме размера партии.
Наконец, если есть веса выборки, эти веса умножаются, также поэлементно, в размерности партии.
Итак:
- поэлементная разница:
y_true - y_pred
(все минус все, сохраняя одинаковую форму) - поэлементно:
K.square(previous_result)
- означает по всем осям, кроме партии:
K.mean(previous_result, axis=1)
# или axis = (1,2)
или (1,2,3)
....
Они видны в функции потерь, шаг весов скрыт:
- применить веса выборки: веса * previous_result
- наконец, среднее из оставшегося измерения