Во-первых, вы должны знать, что перетяжка - это функция с малыми потерями в тренировочном наборе, но функция с большими потерями в тестовом наборе.Во-вторых, вам нужно знать, является ли MSE функцией потерь, которую вы используете, или индикатором оценки для вашей регрессионной задачи.Я думаю, что вы могли нарисовать кривую для индикатора оценки здесь.Вы должны посмотреть на кривую для функции потерь.Наконец, что касается выбора функций активации, верхний этаж совершенно прав.Было бы неплохо использовать линейную функцию активации.