Вы уже пробовали программное обеспечение OCR? Вполне вероятно, что программное обеспечение OCR хорошо подходит для чтения того, что по сути уже является черно-белым изображением.
Однако, если вам необходимо сделать это, вы можете попробовать:
- Порог изображения.
- По существу возьмите версию изображения в оттенках серого и превратите ее в черные / белые пиксели
- Выполните двоичную дилатацию, чтобы вырастить оставшиеся объекты
- Выполнить бинарную эрозию
Идея состоит в том, что, расширяя, а затем размывая, вы удаляете любые неровные / шумные края, а затем вы можете передавать скелетонизированное изображение в OCR.
Вероятно, существует множество методов для достижения аналогичного результата. Учитывая, что есть целые книги, посвященные компьютерному зрению, этот ответ вряд ли сделает их справедливыми.
Единственные тексты, которые у меня есть, относятся к 1997 году, но, безусловно, с тех пор на эту тему написано больше.
- Алгоритмы обработки изображений и компьютерного зрения - J.R. Parker
- Цифровая обработка изображений - Гонсалес / Вудс