Что должно быть 'y_train' в Keras LSTM? - PullRequest
0 голосов
/ 01 сентября 2018

Я ссылаюсь на пример, приведенный на веб-сайте Keras здесь :

from keras.models import Sequential
from keras.layers import LSTM, Dense
import numpy as np

data_dim = 16
timesteps = 8
num_classes = 10

# expected input data shape: (batch_size, timesteps, data_dim)
model = Sequential()
model.add(LSTM(32, return_sequences=True,
           input_shape=(timesteps, data_dim)))  # returns a sequence of vectors of dimension 32
model.add(LSTM(32, return_sequences=True))  # returns a sequence of vectors of dimension 32
model.add(LSTM(32))  # return a single vector of dimension 32
model.add(Dense(10, activation='softmax'))

model.compile(loss='categorical_crossentropy', optimizer='rmsprop', metrics=['accuracy'])

# Generate dummy training data
x_train = np.random.random((1000, timesteps, data_dim))
y_train = np.random.random((1000, num_classes))

# Generate dummy validation data
x_val = np.random.random((100, timesteps, data_dim))
y_val = np.random.random((100, num_classes))

model.fit(x_train, y_train, batch_size=64, epochs=5, validation_data=(x_val, y_val))

Для примера из реального мира, что должно быть y_train и y_val? Должны ли они быть такими же, как x_train и x_val соответственно, поскольку они происходят из одной и той же последовательности?

Кроме того, как я должен понимать data_dim и num_classes?

Ответы [ 2 ]

0 голосов
/ 01 сентября 2018

Это своего рода ответы на мой вопрос.

0 голосов
/ 01 сентября 2018

Поскольку ваш параметр return_sequences = True, ваш LSTM получит пустые массивы формы [batch_size, time_steps, input_features] и выполнит отображение «многие ко многим». Data_dim - это просто число различных функций, которые ваша модель использует в качестве входных данных. Ваша y_train будет иметь форму [[1000, 10]]

Ключ к пониманию выдержки из предоставленного вами кода заключается в том, что установка параметра return_sequences = True позволяет слою LSTM распространять последовательностей значений на вышестоящие уровни в сети. Обратите внимание, что последний слой LSTM, который предшествует 10-полосному softmax, не устанавливает return_sequences = True. Это связано с тем, что плотный слой не может обрабатывать последовательность входных данных - следовательно, измерение time_steps свернуто, а плотный слой получает вектор входных данных, который он может обработать без проблем.

...