Функции преобразования изображения, чтобы определить, был ли текст в документе изначально там или только синтетически наложен - PullRequest
1 голос
/ 04 февраля 2020

У меня есть копия отсканированного древнего грязного документа и синтетически сгенерированные древние грязные документы. Я хочу использовать дискретное косинусное преобразование, чтобы охарактеризовать типы шума, существующие в документе, и определить, был ли текст в документе изначально там или только синтетически наложен.

Коэффициенты DCT обычно классифицируются на три поддиапазона на основе их частоты, а именно низкие, средние и высокие полосы частот. Низкая частота может быть связана с сущностью текста, а высокая частота связана с фоновым шумом. Я могу охарактеризовать типы шума (пятна, неровный фон и т. Д. c.) Путем получения и классификации стандартного отклонения высокочастотного DCT. Но мой вопрос заключается в том, можно ли определить, был ли текст в документе изначально там или просто наложен синтетическим путем, анализируя низкочастотные данные DCT? Если нет, какие другие функции преобразования я могу использовать, чтобы различить guish что?

Спасибо. Любая помощь будет очень ценится.

...