Хотел бы поделиться своим пониманием о MSE и cross_binary_entrophy .
В случае классификации мы берем argmax () вероятностикаждого обучающего экземпляра.
Теперь рассмотрим пример двоичного классификатора, где модель предсказывает вероятность как (.49, .51).В этом случае модель вернет «1» в качестве прогноза.
Assume if actual label is also "1".
В этом случае, если используется MSE, она вернет 0 в качестве значения потерь, тогда как cross_binary_entrophy вернет некоторое материальное значение.И если каким-либо образом со всей выборкой данных обученная модель предсказывает подобный тип вероятности, то cross_binary_entrophy эффективно возвращает большое значение накопленной потери, тогда как MSE вернет 0 .
According to MSE, its a perfect model, but in actuality its not a that good model, that's why we should not use MSE for classification.