Почему требуется сбросить состояние в Stateful LSTM? - PullRequest
0 голосов
/ 06 ноября 2018

Я предполагаю, что состояние - это значение c, которое один узел переносит на другой узел в модели LSTM. Если данные должным образом нормализованы, то состояние должно быть сгенерировано из правильной регрессии и должно быть полезным в следующем пакете. Лично я всегда находил модели, сходящиеся вскоре без сброса состояния. Может ли кто-нибудь привести пример, когда состояние сброса могло бы привести к сходимости модели раньше или точнее, чем ее сброс?

LSTM single node

...