Я обучаю сеть с 7 уровнями кодирования (conv, BN, relu, maxpool) и 5 уровнями декодирования (conv, BN, relu, Upsampling).
Входные данные представляют собой матрицу размером 64 * 2000, а выходные данные представляют собой матрицу 125 * 256. Цель сети - интерпретировать необработанные данные, записанные датчиком, и прогнозировать скорость волны в соответствующей среде.
Я пытался обучить сеть с набором данных 200, 2000, 6000. Я использую как валидацию (0.1), так и тест. Независимо от того, насколько большой или маленький мой набор данных, я застряну с той же ошибкой проверки и проверки, которая не может предсказать ожидаемое свойство. Я ожидаю и RMSE 10-25, и я получаю RMSE 60-70. (RMSE начинается в 1540-1550, что абсолютно логично, и в конце концов, в 60-70 гг. он застрял с любым количеством эпох, размером партии или любым оптимизатором.)
Я ожидаю, что если я обучу свою сеть на небольшом наборе данныхЯ получаю большую среднеквадратичную величину в моем тестовом наборе данных по сравнению с набором данных, скажем, в 30 раз больше. Как я могу интерпретировать то, что я наблюдаю здесь? Я учу шум?