Я пытаюсь понять последовательное обучение с RNN.Что я понимаю до сих пор, так это то, что выход кодера используется для кондиционирования декодера.
Тем не менее, у меня есть два источника, которые, по моему мнению, делают обусловленность по-разному, и я хотел бы знать, какой путь действителен (может быть и тем и другим) или если я что-то упустил.
Источник: Нейросетевые методы для обработки естественного языка. Йоав Голдберг
Насколько я понимаю автора, декодер работает на каждом этапе с вектором состояния И выходом декодера И следующей частьюпоследовательность.Таким образом, вектор состояния декодера отделен от результата кодера.
![enter image description here](https://i.stack.imgur.com/Ifoz5.png)
Источник: десятиминутное введение в последовательностьизучение последовательностей в Keras Франсуа Шоле
Насколько я понимаю автора и источника, декодеру предоставляется состояние кодера в качестве начального состояния.Таким образом, вектор состояния декодера является выходным сигналом декодера.Шаги декодера зависят только от выхода кодера через вектор состояния.
![enter image description here](https://i.stack.imgur.com/cGqc7.png)