Question

Я пытался обучить SRGAN-модель на моем наборе текстовых изображений.Это 100 160x30 .png файлов.

Вот модель: https://github.com/leftthomas/SRGAN/blob/master/model.py https://github.com/leftthomas/SRGAN/blob/master/train.py (я ничего не изменил, кроме пути к моему набору данных)

Я установил на crop_size значение 24, для повышения - до 2 и начал тренировку, но затем возникает следующая ошибка:

RuntimeError: Given groups=1, weight of size [64, 3, 9, 9], expected input[64, 4, 12, 12] to have 3 channels, but got 4 channels instead

Я уверен, что все мои изображения имеют 3 канала, что подтверждаетсяimg.shape.

Тем не менее, я застрял и, честно говоря, понятия не имею, где именно этот четвертый канал может быть.

Почему Pytorch утверждает, что мой вход имеет 4 канала?

Пожалуйста, войдите или зарегистрируйтесь чтобы ответить на этот вопрос.