У вас очень мало данных для глубокого изучения.
Согласно графику, очень вероятно, что вы подходите к набору валидации. Есть и другие случаи, когда потеря при проверке может быть меньше потери при обучении, учитывая случаи, когда отсев не включен, когда тестирование и / или проверка действительно проста.
Мое предложение - увеличить вашнабор данных значительно, по крайней мере 20000 выборок в целом разделены следующим образом (16000 - 2000 - 2000). Для обучения LSTM требуется много данных.