Модель глубокого обучения для очистки документов - PullRequest
0 голосов
/ 05 ноября 2018

Я пытаюсь создать сверточный автоматический кодировщик, который может удалять отметки, такие как круги, подчеркивания и т. Д., Из официальных документов.

У меня есть оригинальная, чистая мягкая копия документа и ксероксная копия с отметками пера.

Ксерокопированная копия, очевидно, не полностью совпадает с исходным документом и будет слегка перекошена или смещена и т. Д. При сканировании.

Кроме того, поскольку размер документа огромен (2360, 1650), мне пришлось разделить изображение на 4 части (587, 412) для ввода в мою модель.

Что мне хотелось бы знать, так это то, могут ли вышеуказанные проблемы вызвать какие-либо проблемы во время тренировки и есть ли способ исправить это?

Любая помощь будет принята с благодарностью.

Спасибо

EDIT:

Original Image

Noisy Image

Как вы можете видеть (надеюсь !!), изображение с шумом немного отличается из-за асимметрии или перевода во время ксерокса.

1 Ответ

0 голосов
/ 05 ноября 2018

Не думаю, что это вызовет какие-либо проблемы. Но, если это так, вы всегда можете загрузить изображение, изменить его размер до желаемой формы и затем ввести его в модель.

...