Я новичок в seq2seq, и я не совсем понимаю, что такое значение активации и что такое скрытое состояние, когда дело доходит до выхода энкодера?
и как внимание использует выход энкодера?