Я хочу создать своего рода python скрипт, который может это сделать.
В моем случае мне просто нужно очень простое разворачивание, как показано ниже
- Всегда с одинаковым фоном
- Всегда размещать страницу в одинаковом положении
- Всегда иметь один и тот же тип обернутого изображения
I tried following methods but didn't work out.
I tried so many scanning apps but no app can unwarp 3d wrap
for example this one Объектив Microsoft Office
.
I tried page_dewarp.py . Но он не работает со страницами, имеющими пробелы между текстами или сегменты текстов, и в большинстве случаев для таких изображений он просто отключает лечение слева направо или наоборот, а также не может обнаружить фактическую текстовую область, например
I found deep-learning-for-document-dewarping , который пытается решить эту проблему с помощью pix2pixHD Но я не уверен, что это хорошо, и в этом проекте нет обученных моделей и в настоящее время не решая проблему. должен ли я обучать модель только с использованием следующих обучающих данных train_A
- искаженные входные изображения и train_B
- неискаженные выходные изображения, как указано в pix2pixHD . Я могу генерировать обучающие данные, создавая деформированные и неискаженные изображения с помощью blender 3d. Таким образом, я могу сгенерировать так много изображений, используя страницы некоторых отсканированных книг, просто визуализировав неискаженное изображение и деформировав его, как будто кто-то фотографирует страницы, но виртуально.