Я пытаюсь оценить кадры из 5 наборов видеоданных с помощью модели со слоями CONVLSTM2D. Я извлек свои данные так, что их размеры равны (5,6912,1,40,40), где количество кадров = 6912 и изображений = (40,40,1), а мои метки равны (5,6912). Ярлыки имеют значения от 0 до 5.
tf.config.experimental.list_physical_devices(device_type=None)
model = Sequential()
model.add(ConvLSTM2D(filters=40,kernel_size=(3,3),input_shape=(6912,1,40,40),data_format='channels_first',padding='same',return_sequences=True))
model.add(BatchNormalization())
model.add(MaxPooling3D(pool_size=(1,4,2), padding='same',data_format='channels_first'))
model.add(ConvLSTM2D(filters=10,kernel_size=(3,3),data_format='channels_first',padding='same',return_sequences=True))
model.add(BatchNormalization())
model.add(MaxPooling3D(pool_size=(10,10,2), padding='same',data_format='channels_first'))
model.add(Dense(1, activation="softmax"))
model.compile(optimizer='rmsprop',
loss='sparse_categorical_crossentropy',
metrics=['accuracy'])
Я новичок в этой области и учусь, поэтому, пожалуйста, дайте предложения, чтобы я мог лучше запускать код. Размер pool_size для каждого устанавливается методом пробного запуска, поскольку я хотел проверить, работает ли код.