Правильный способ генерации начальных случайных векторов для модели генератора в GAN? - PullRequest
0 голосов
/ 23 мая 2018

Часто линейная интерполяция используется с гауссовым или равномерным априором, который имеет единичную дисперсию и нулевое среднее, где размер вектора может быть определен произвольным образом, например, 100 для генерации начальных случайных векторов для модели генератора в Generative Adversarial Neural (GAN).).

Допустим, у нас есть 1000 изображений для обучения, а размер пакета равен 64. Затем в каждую эпоху необходимо генерировать количество случайных векторов, используя предварительное распределение, соответствующее каждому изображению в данной небольшой партии.Но проблема, которую я вижу, состоит в том, что, поскольку нет никакого отображения между случайным вектором и соответствующим изображением, одно и то же изображение может быть сгенерировано с использованием нескольких начальных случайных векторов.В этой статье она предлагает преодолеть эту проблему путем использования различной сферической интерполяции до некоторой степени.

Так что же произойдет, если первоначально генерировать случайные векторы, соответствующие количеству обучающих изображений, и когда поезд использует модель того же случайного вектора, который был создан изначально?

1 Ответ

0 голосов
/ 23 мая 2018

В GAN случайное начальное число, используемое в качестве входных данных, фактически не соответствует никакому реальному входному изображению.На самом деле GAN изучают функцию преобразования из известного распределения шума (например, гауссовского) в сложное неизвестное распределение, которое представлено выборками iid (например, вашим обучающим набором).Что делает дискриминатор в GAN, так это вычисляет расхождение (например, расхождение Вассерштейна, расхождение KL и т. Д.) Между сгенерированными данными (например, преобразованным гауссовским) и реальными данными (вашими данными обучения).Это сделано стохастическим способом, и поэтому нет никакой связи между реальными и фальшивыми данными.Если вы хотите узнать больше об этом на собственном примере, я могу порекомендовать вам потренироваться в обучении GANS Вассерштейна для преобразования одного одномерного гауссовского распределения в другой.Там вы можете визуализировать дискриминатор и градиент дискриминатора и реально увидеть динамику такой системы.

В любом случае, ваша статья пытается вам сказать, что после того, как вы обучили свою GAN и хотите увидеть, какон отобразил сгенерированные данные из известного пространства шума в неизвестное пространство изображения.По этой причине схемы интерполяции были придуманы как сферические, которые вы цитируете.Они также показывают, что GAN научился отображать некоторые части скрытого пространства на ключевые характеристики на изображениях, такие как улыбки.Но это не имеет ничего общего с обучением GAN.

...