Например, мы хотим использовать прошлые значения Xt-1, Xt-2, Xt-3, Xt-4, Xt-5 для прогнозирования Xt. Мы можем создать сеть LSTM, как показано на рисунке 1002 *, с шагом по времени, равным 5. Я не уверен, что при прогнозировании Xt LSTM будет использовать только воспоминания Xt-1, Xt-2, Xt- 3, Xt-4, Xt-5 или те, что были в далеком прошлом, такие как Xt-6, Xt-7, Xt-8?