Что может быть решением для автоматического устранения искажения изображения документа, вызванного трехмерным искажением? - PullRequest
0 голосов
/ 21 июня 2020

Я хочу создать своего рода python скрипт, который может это сделать.

В моем случае мне просто нужно очень простое разворачивание, как показано ниже

  1. Всегда с одинаковым фоном
  2. Всегда размещать страницу в одинаковом положении
  3. Всегда иметь один и тот же тип обернутого изображения ApplicationFrameHost_OBhqMlLofR

I tried following methods but didn't work out.

  • I tried so many scanning apps but no app can unwarp 3d wrap for example this one Объектив Microsoft Office
    image.

  • I tried page_dewarp.py . Но он не работает со страницами, имеющими пробелы между текстами или сегменты текстов, и в большинстве случаев для таких изображений он просто отключает лечение слева направо или наоборот, а также не может обнаружить фактическую текстовую область, например
    output of page_dewarp.py

  • I found deep-learning-for-document-dewarping , который пытается решить эту проблему с помощью pix2pixHD Но я не уверен, что это хорошо, и в этом проекте нет обученных моделей и в настоящее время не решая проблему. должен ли я обучать модель только с использованием следующих обучающих данных train_A - искаженные входные изображения и train_B - неискаженные выходные изображения, как указано в pix2pixHD . Я могу генерировать обучающие данные, создавая деформированные и неискаженные изображения с помощью blender 3d. Таким образом, я могу сгенерировать так много изображений, используя страницы некоторых отсканированных книг, просто визуализировав неискаженное изображение и деформировав его, как будто кто-то фотографирует страницы, но виртуально.

...