Я настроил GAN, который работает для генерации цифр mnist, и сейчас я пытаюсь настроить его на работу с автомобилями из cifar10.Однако выходные данные для автомобилей cifar10 обычно являются монохромными и периодически переключаются на разные цвета по мере уменьшения потерь генератора и увеличения потерь дискриминатора.
Вот графики потерь генератора и дискриминатора при обучении на mnist:
Напротив, потери для cifar10 остаются плоскими в течение длительных периодов перед внезапным скачком:
Для cifar10 GAN генерирует почтимонохромные изображения разных оттенков, например:
Примерно через 10 эпох он начинает выводить интересные текстуры, не похожие на изображения:
Работа в течение 50 эпох не улучшает качество изображения.Структура потери становится менее очевидной, но вы все равно можете видеть обычные пики в начале тренировки:
Я пробовал возиться с темпами обучения, функциями активации, количеством слоев, размером сверточного ядра, метками с шумом, метками с переворотом, вводом с шумоподавителем и т. Д., Но, похоже, ничего не работает.Кажется более вероятным, что существует более серьезная проблема, чем просто неправильные гиперпараметры.
Кто-нибудь распознает этот ненормальный паттерн в потере?