Вопрос: Если скорость обучения (а) слишком велика, что происходит с графиком и как это может повлиять на функцию потерь с итерациями
Я где-то читал, что график может не сходиться или там может быть много колебаний на графике, я просто хотел бы прояснить это. Я также не уверен, как это может повлиять на функцию потерь при построении графика.