Библиотека OCR для фотографий, а не отсканированных изображений - PullRequest
1 голос
/ 31 марта 2010

Кто-нибудь знает библиотеку OCR, которая может обрабатывать цветные фотографии (в отличие от отсканированных страниц)?

Мне кажется, что большинство библиотек работают с черно-белыми изображениями и ожидают, что они поступят со сканера. Мне нужно что-то, что может сделать цветную фотографию, скажем, афиши и извлечь из нее текст.

В настоящее время я рассматриваю возможность преобразования этих изображений в черно-белые и передачи их в одну из библиотек, упомянутых в в этом вопросе , но я настроен скептически ... Эти библиотеки, вероятно, разработаны с учетом изображения представляют собой отсканированные документы или отсканированные страницы книг. Мне нужно что-то, что могло бы работать с текстом в любой ориентации, с разными размерами, странными выравниваниями и т. Д., В основном, что-то, что могло бы извлечь большую часть текста из этих изображений - это не должно быть на 100% точным.

Есть идеи?

1 Ответ

1 голос
/ 01 апреля 2012

Вы можете использовать без бумаги для выравнивания. GOCR для OCR. Обычно программное обеспечение, которое получает цветовой ввод, преобразует его в оттенки серого перед обработкой - это всего лишь этап предварительной обработки, который выполняют люди или программное обеспечение самостоятельно.

Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...