как увеличить разрешение текста в отсканированных изображениях в python? - PullRequest
7 голосов
/ 08 мая 2020

Я использую tesseract-OCR для извлечения текста из отсканированных изображений. Для некоторых изображений текст не распознается должным образом из-за низкого разрешения, и в результате выводятся некоторые несоответствующие символы.

Применяемые методы:

  1. Увеличьте dpi до 300.

  2. Методы предварительной обработки изображений в opencv.

  3. Масштабирование изображений с использованием dnn_superres в opencv

  4. Методы удаления шума.

  5. Реферируемые git репозитории, в которых модель алгоритма сверхвысокого разрешения разработана с использованием Deep обучение.

  6. Улучшение качества tesseract-ocr путем обучения tessdata.

Ссылки на ссылки :

  1. Повышение точности оптического распознавания символов отсканированных документов
  2. обработка изображений для повышения точности оптического распознавания текста в тессеракте

Пример изображения:

enter image description here

Есть ли простой способ в python улучшить текст без использования какой-либо модели глубокого обучения.

1 Ответ

4 голосов
/ 14 мая 2020

Я знаю, что вы предпочли бы масштабировать эти входные изображения с помощью глубокого обучения, но я настоятельно рекомендую поэкспериментировать с https://github.com/alexjc/neural-enhance, предполагая, что у вас есть соответствующее оборудование для запуска нейронных сетей и глубокого обучения. .

Результаты для ваших входных изображений OCR могут быть многообещающими. Документация по коду довольно обширна.

Надеюсь, это вам поможет!

...