Вы используете два довольно небольших слоя LSTM, чтобы предсказать, как я предполагаю, ограниченные данные.Поэтому отношения, полученные между входом и выходом, будут довольно простыми (в отличие от глубокой модели).
Что касается вашего вопроса, вы должны проанализировать результаты в соответствии с вашей функцией стоимости.Использование функции стоимости, такой как MSE, оштрафует модель за наличие больших расхождений между выходными и истинными значениями, и кажется, что модель узнала здесь, что значение (около 900) является значением, которое минимизирует MSE, используя небольшое количестводоступных параметров.Так это "ненормально", как вы описали?Я бы сказал, что было бы ненормально, если линия не выглядела как линия наилучшего соответствия для более низких значений данных.
Я бы посоветовал вам использовать более простую сеть, если ваши тренировочные данныенедостаточно (см., возможно, CNN, или оконные ANN), или просмотр возможности получения большего количества обучающих данных.