Я пытался обучить SRGAN-модель на моем наборе текстовых изображений.Это 100 160x30 .png файлов.
Вот модель: https://github.com/leftthomas/SRGAN/blob/master/model.py https://github.com/leftthomas/SRGAN/blob/master/train.py (я ничего не изменил, кроме пути к моему набору данных)
Я установил на crop_size значение 24, для повышения - до 2 и начал тренировку, но затем возникает следующая ошибка:
RuntimeError: Given groups=1, weight of size [64, 3, 9, 9], expected input[64, 4, 12, 12] to have 3 channels, but got 4 channels instead
Я уверен, что все мои изображения имеют 3 канала, что подтверждаетсяimg.shape
.
Тем не менее, я застрял и, честно говоря, понятия не имею, где именно этот четвертый канал может быть.