Архитектура глубокого обучения для проблемы регрессии - PullRequest
0 голосов
/ 02 июля 2019

У меня есть проблема регрессии, когда я хочу оценить 10 выходов реального значения (c1, ..., c10) из 5 входов реального значения (p0, ..., p4).

enter image description here

Я протестировал множество архитектур глубоких сетей, таких как: 5 -> 512 -> 512 -> 512 -> 128 -> 128 -> 128 -> 10, которые имеют функцию активации RELU и оптимизатор Adamax со скоростью обучения 0,005.

Однако для всех протестированных архитектур скорость обучения, функции активации ... Моя функция потери сходится к значению, которое я считаю неоптимальным.

enter image description here

Как я могу улучшить результаты моей регрессии?

Есть ли у вас какие-либо предложения по использованию других моделей или архитектур?

На каком гиперпараметре я могу играть, чтобы не сходиться быстро?

Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...