Я пытаюсь создать синтетические рукописные данные.Я наткнулся на GAN, который используется для генерации изображения одного персонажа.
Генератор: увеличивает случайный тензор до изображения.
Дискриминатор: использует реальные данные для классификации реальных / сгенерированных.
Но мы не можем контролировать, какой вывод символов нам нужен.
У меня есть рукописный набор данных, содержащий изображения слов (IAM).
Если для уровня слова нам нужны отдельные GAN для каждого слова?
Мне нужно аннотировать выходное изображение словом (для распознавания слов).
Существует ли сеть GAN, которая выводит синтетические рукописные изображения для слов, а не в обучающем наборе данных?