Я хотел бы проверить свою функцию потерь, потому что я прочитал, что есть проблемы с функцией потерь mse в кератах.Рассмотрим модель lstm в кератах, предсказывающую трехмерные временные ряды как мультицелевые (y1, y2, y3).Предположим, что форма пакета выходных последовательностей имеет вид (10, 31, 1). Будет ли функция потерь ниже принимать квадратичную разницу между прогнозируемым и истинным выходом, а затем принимать среднее значение из 310 выборок, что приведет к единственному значению потерь?Как эта операция произойдет, если 3 выхода будут объединены как (10, 31, 3)
def mse(y_true, y_pred):
return keras.backend.mean(keras.backend.square(y_pred - y_true), axis=1)