Я пытаюсь понять, как работает lstm для прогнозирования временных рядов с Керасом.Вот мой пример.Я использую акселерометр и у меня 128.000 временных рядов.Я подумал взять: n_steps_in = 10.000 n_steps_out = 5.000 для прогнозирования.
Я разделил большой ряд на 114 выборок, 10.000 временных рядов и 1 особенность X = [114, 10.000, 1] y = [114, 5.000]
Я пытаюсь понять, сколько скрытых слоев использовать, сколько нейронов.Будучи регрессом, я подумал использовать
activation=ReLU,
loss = mse
optimizer=adam
Проблема в том, что много раз я получал убытки равные нан, и я не могу понять, почему.
Это пример моего кода
model1 = Sequential()
model1.add(LSTM(200, activation='relu', input_shape=(n_steps_in, n_features)))
model1.add(Dense(n_steps_out))
model1.compile(optimizer='adam', loss='mse')
Буду надеяться, что кто-то получил несколько советов, спасибо !!