Мне было интересно, можно ли заменить функцию потерь модели слоем, имеющим в качестве функции активации функцию потерь.Если да, как это повлияет на сеть?Как будет работать градиентный спуск?Как я могу получить прогноз, если я сделаю это?