
Я пытаюсь реализовать модель, показанную на картинке выше, которая в основном состоит из распределенных по времени CNN, за которыми следует последовательность LSTM с использованием Keras с TF.Я разделил два типа классов и извлек кадры из каждого захваченного видео.Извлечение кадров является переменным, не исправляйте.
Однако у меня возникла проблема при попытке выяснить, как можно загрузить свои кадры изображений для каждого видео в каждом классе, чтобы они стали x_train
, x_test
,y_train
, y_test
.
model = Sequential()
model.add(
TimeDistributed(
Conv2D(64, (3, 3), activation='relu'),
input_shape=(data.num_frames, data.width, data.height, 1)
)
)
Я не знаю, как набрать data.num_frames
, если каждое видео содержит n разного количества извлеченных кадров.
Входные данные - это небольшие видео всего 3-8 секунд (т.е. последовательность кадров).