Мне трудно понять производительность модели LSTM, поскольку я обобщаю свою модель следующим образом:
X_train.shape
(120, 7, 11)
y_train.shape
(120,)
X_test.shape
(16, 7, 11)
y_test.shape
(16,)
model = keras.Sequential()
model.add(keras.layers.LSTM(100, input_shape=(X_train.shape[1], X_train.shape[2]), return_sequences = True))
model.add(keras.layers.Dropout(rate = 0.2))
model.add(keras.layers.LSTM(20))
model.add(keras.layers.Dropout(rate = 0.2))
model.add(keras.layers.Dense(1))
model.compile(loss='mean_squared_error', optimizer=keras.optimizers.Adam(0.001), metrics = ['mae'])
history = model.fit(
X_train, y_train,
epochs=60,
batch_size=5,
verbose= 0,
validation_split = 0.1,
shuffle=False
)
На основе приведенных ниже графиков, как MSE, так и MAE уменьшаются в процессе обучения, и их соответствующие значения около нуля.
Однако, как я понимаю, прогноз недостаточно точен:
y_pred = model.predict(X_test)
model.evaluate(X_test,y_test)
[0.04673878103494644, 0.15574690699577332]
Итак, мой вопрос, как на самом деле работает моя модель? Я имею в виду, как можно интерпретировать его производительность, так как MSE и MAE кажутся низкими, но значения прогноза не совсем убедительны.