Это развернутая диаграмма рН.
Диаграмма задачи:
Автор говорит, что он использует этоrnn модель для обучения rnn модели для предсказания следующего символа, поэтому я могу понять, что y (t) объединяется с X (t + 1) на входе для следующего шага, так как y (t + 1) зависит от y (t),Но тогда что этот u (t) делает здесь?как это помогает?