Я бы сказал, что потеря сильно зависит от того, какие параметры вы используете для обучения. С другой стороны, я бы не назвал это зависимостью с точки зрения математической функции, а скорее отношением.
Если ваша сеть не обучается, вам необходимо настроить параметры (архитектуру, скорость обучения, размер пакета и т. Д. c.).
Трудно дать более конкретную информацию c ответ на свой вопрос. Какие параметры в порядке, в зависимости от проблемы. Однако, если оно сходится и вы можете подтвердить свое решение, я бы сказал, что у вас все хорошо.