В контексте градиента descent algorithms
(не линейная регрессия), если функция стоимости уже находится на локальном минимуме, что происходит дальше?или как он достигает глобального оптимума в дальнейшем?
В случае линейной регрессии существует только один минимум и, следовательно, нет проблемы локального минимума.Но как насчет других алгоритмов, которые могут иметь локальный минимум и глобальный минимум?