Я пытаюсь обучить CNN на видео последовательностях. Мои input_data имеют форму (5874, 1, 10, 128, 128), которые представляют (n_samples, channel, frames, height, width). Ошибка - либо дано 4 измерения, но даны 5 ожидаемых или 6 измерений. Как правильно управлять Conv3D?
настройка Input((1,10,128,128))
приводит к: ValueError: Error when checking input: expected input_1 to have 5 dimensions, but got array with shape (1, 128, 128, 10)
. но ошибка генерируется после примерки.
установка Input((1,1,10,128,128))
приводит к: ValueError: Input 0 of layer conv3d_6 is incompatible with the layer: expected ndim=5, found ndim=6. Full shape received: [None, 1, 1, 128, 128, 10]
после выполнения модели (перед установкой)
Я уже просмотрел всю возможную документацию и форумы и ничего не нашел. Любые советы будут полезны.
dataset = tf.data.Dataset.from_tensor_slices((data, labels)))
dataset = dataset.shuffle(10000)
train_dataset, valid_dataset = split_dataset(dataset, 0.02)
model = tf.keras.Sequential()
model.add(Input((1,10,128,128)))
model.add(Conv3D(filters = 8, kernel_size=(10,5,5), padding="same", activation="relu", data_format="channels_first"))
model.add(BatchNormalization())
model.add(Conv3D(filters = 8, kernel_size=(10,3,3), padding="same", activation="relu"))
model.add(BatchNormalization())
model.add(MaxPool3D(pool_size=(1,2,2), strides=(1,1,1)))
model.add(Conv3D(filters = 16, kernel_size=(5,5,5), padding="same", activation="relu"))
model.add(BatchNormalization())
model.add(Conv3D(filters = 16, kernel_size=(5,3,3), padding="same", activation="relu"))
model.add(BatchNormalization())
model.add(MaxPool3D(pool_size=(2,2,2), strides=(1,1,1)))
model.add(Conv3D(filters = 32, kernel_size=(5,5,5), padding="same", activation="relu"))
model.add(BatchNormalization())
model.add(Conv3D(filters = 32, kernel_size=(3,3,3), padding="same", activation="relu"))
model.add(BatchNormalization())
model.add(MaxPool3D(pool_size=(2,2,2), strides=(1,1,1)))
model.add(Flatten())
model.add(Dropout(0.2))
model.add(Dense(512, activation="relu"))
model.add(Dropout(0.2))
model.add(Dense(5, activation="softmax"))
model.compile(optimizer=tf.keras.optimizers.Adam(lr=0.01) , loss="sparse_categorical_crossentropy", metrics=["accuracy"])
r = model.fit(train_dataset, verbose=1, validation_data=valid_dataset, epochs=50)