Меняется ли скрытое состояние в LSTM / GRU во время прогнозирования? - PullRequest
0 голосов
/ 20 июня 2020

Допустим, я создаю такую ​​модель:

from tensorflow.keras.models import Sequential
from tensorflow.keras.layers import Dense, Input, GRU

model = Sequential()

model.add( Input( shape=(1,3), batch_size=2 ) )
model.add( GRU(1, stateful=True) )
model.add( Dense(1) )

model.compile( loss="mse", optimizer="adam" ) 

Если я вызову model.predict () с некоторым пакетом входных данных, изменят ли эти входные данные скрытое состояние (recurrent_kernel_weights)?

Если нет, то почему? Я предположил, что скрытое состояние меняется с каждым входом, чтобы нейрон RNN запомнил это позже.

Я вызвал прогноз с указанными ниже входами, и скрытое состояние не изменилось.

import numpy as np 

inp2 = np.ones(3)
inp3 = np.reshape(inp2, (1,3))
inp4 = []
inp4.append(inp3)
inp4.append(inp3)

inp4 = np.reshape(inp4, (2,1,3))

model.predict(inp5)

...