У меня есть проблема регрессии, когда я хочу оценить 10 выходов реального значения (c1, ..., c10) из 5 входов реального значения (p0, ..., p4).

Я протестировал множество архитектур глубоких сетей, таких как: 5 -> 512 -> 512 -> 512 -> 128 -> 128 -> 128 -> 10, которые имеют функцию активации RELU и оптимизатор Adamax со скоростью обучения 0,005.
Однако для всех протестированных архитектур скорость обучения, функции активации ... Моя функция потери сходится к значению, которое я считаю неоптимальным.

Как я могу улучшить результаты моей регрессии?
Есть ли у вас какие-либо предложения по использованию других моделей или архитектур?
На каком гиперпараметре я могу играть, чтобы не сходиться быстро?