Автоэнкодер для уменьшения размеров больших цветных изображений - PullRequest
0 голосов
/ 27 мая 2020

Я пытаюсь использовать AutoEncoder для сжатия цветных изображений с размерами 640x480. Код, который я использую, взят с этого веб-сайта , где используется набор данных mnist. Изображения в mnist очень маленькие (28x28), а сеть имеет только 784 входа. Когда я пытаюсь заменить свой набор данных изображений (изображения 640x480), входные данные увеличиваются до (640 * 480 * 3 = 921600) входов. Изменив любой из гиперпараметров, то есть плотный слой кодировщика с 300 до 500, я получаю ожидаемую ошибку нехватки памяти (при работе в Google Colab).

Я также попытался преобразовать изображения в оттенки серого, что привело к уменьшению размеров до 307200. Это дает мне некоторую свободу в настройке параметров, т.е. размер пакета, но этого недостаточно для значительного увеличения плотности слоя кодировщика с проблемами нехватки памяти.

Одна стратегия, которую я хотел бы попробовать, - это разбить изображение на меньшие изображения и обучить сеть, используя эти меньшие изображения. Не уверен, к каким результатам это приведет, но, по крайней мере, сеть сможет обрабатывать объем вводимых данных.

Существуют ли какие-либо стратегии, которые можно использовать для обработки больших изображений в этом случае? Все примеры на inte rnet используют очень маленькие размерные изображения. Мы будем благодарны за любой пример или совет.

Заранее спасибо

...