В настоящее время я использую модель ConvLSTM из официального репозитория Keras.Одной из наиболее сложных частей понимания модели является сложность понимания того, что происходит на каждом этапе процесса.Официальный код можно найти здесь .Глядя на модель последовательности, множественные вхождения уровней пакетной нормы и сверточного LSTM не являются очевидным выбором, и довольно сложно понять, что они на самом деле делают.
seq = Sequential()
seq.add(ConvLSTM2D(filters=40, kernel_size=(3, 3),
input_shape=(None, 40, 40, 1),
padding='same', return_sequences=True))
seq.add(BatchNormalization())
seq.add(ConvLSTM2D(filters=40, kernel_size=(3, 3),
padding='same', return_sequences=True))
seq.add(BatchNormalization())
seq.add(ConvLSTM2D(filters=40, kernel_size=(3, 3),
padding='same', return_sequences=True))
seq.add(BatchNormalization())
seq.add(ConvLSTM2D(filters=40, kernel_size=(3, 3),
padding='same', return_sequences=True))
seq.add(BatchNormalization())
Мрачное понимание того же - это то, что оно помогает извлечь особенности кадра, используя полезность сверток, когда дело доходит до изображений.Входные данные - это кадры видео.Было бы очень полезно, если бы я мог визуализировать выходные данные каждого слоя, это может помочь мне лучше понять, чему способствуют слои сверточного LSTM на каждом этапе.Любые предложения о том, как идти об этом или указатели в этом направлении приветствуются.Спасибо за ваше время.