Генерирование синтетических рукописных слов с использованием GAN - PullRequest
0 голосов
/ 12 марта 2019

Я пытаюсь создать синтетические рукописные данные.Я наткнулся на GAN, который используется для генерации изображения одного персонажа.

Генератор: увеличивает случайный тензор до изображения.

Дискриминатор: использует реальные данные для классификации реальных / сгенерированных.

Но мы не можем контролировать, какой вывод символов нам нужен.

У меня есть рукописный набор данных, содержащий изображения слов (IAM).

Если для уровня слова нам нужны отдельные GAN для каждого слова?

Мне нужно аннотировать выходное изображение словом (для распознавания слов).

Существует ли сеть GAN, которая выводит синтетические рукописные изображения для слов, а не в обучающем наборе данных?

1 Ответ

0 голосов
/ 12 марта 2019

Вы используете сеть GAN, которая состоит из двух частей:

  • Генератор : подделывает случайный шум в изображение. Он обучается с использованием потерь, вызванных дискриминатором.

  • Дискриминатор : Различает реальные и предсказанные изображения. Соответственно, потеря рассчитывается.

Дискриминатор сопоставляет реальные и предсказанные изображения. Если я покажу дискриминатору изображение символа «2», он сравнит прогноз с этим изображением. Соответственно, потеря будет рассчитана, и генератор извлечет уроки из этой потери.

Следовательно, если вы покажете изображение символа «3», то генератор попытается сгенерировать изображения символа «3», чтобы он мог одурачить дискриминатор.

Вы, подавая разные изображения на генератор, можете подделать случайный шум на любой желаемый выход.

...