Расположение текста в изображении - PullRequest
26 голосов
/ 05 августа 2008

Я сейчас работаю над проектом, и моя цель - найти текст на изображении. OCR'ing текст пока не является моим намерением. Я хочу в основном получить границы текста в изображении. Я использую компонент обработки изображений AForge.Net для манипуляций. Любая помощь в том или ином смысле?

Обновление 2/5/09: С тех пор я пошел по другому маршруту в моем проекте. Однако я попытался получить текст с помощью MODI (Microsoft Office Document Imaging). Он позволяет вам с легкостью распознать изображение и извлечь из него текст.

Ответы [ 4 ]

12 голосов
/ 05 августа 2008

Это активная область исследований. Есть буквально куча научных работ на эту тему. Будет трудно оказать вам помощь, особенно без дополнительных данных. Вы ищете конкретные типы текста? Шрифты? Только английский? Вы знакомы с академической литературой?

«Обнаружение текста» является стандартной проблемой в любой системе OCR (оптическое распознавание символов), и, следовательно, в паутинах, связанных с ним, имеется много бит кода.

Я мог бы начать перечислять кучу ссылок из Google, но я предлагаю вам просто выполнить поиск по "обнаружению текста" и начать читать :). Также имеется достаточно примеров кода.

3 голосов
/ 05 августа 2008

распознавание текста внутри изображения - действительно горячая тема для исследователей в этой области, но он начал выходить из-под контроля, когда капча стала "нормой" в плане защиты от спам-ботов. Зачем использовать капчу в качестве защиты? хорошо, потому что было / было очень трудно найти (и прочитать) текст внутри изображения!

Причина, по которой я упоминаю капчу, заключается в том, что наибольшее продвижение * сделано в этой крошечной области, и я думаю, что ваше решение может быть найдено лучше всего там. особенно потому, что капчи действительно нацелены на то, чтобы найти текст (или что-то похожее на текст) внутри загроможденного изображения и впоследствии попытаться правильно прочитать буквы.

так что если вы можете найти хороший инструмент для разрыва капчи с открытым исходным кодом у вас, вероятно, есть все, что вам нужно для продолжения вашего квеста ...
Вы могли бы даже выбросить самый сложный код, который обрабатывает само распознавание символов, потому что эти OCR используются для чтения искаженного текста, что вам не нужно делать.

*: продвижение в терминах видимой, полезной и практической информации для "не исследователя"

0 голосов
/ 19 апреля 2013

Преобразование ширины штриха может сделать это за вас. Это, по крайней мере, то, что MS разработала для своих ОС для мобильных телефонов. Обсуждение реализации - здесь https://stackoverflow.com/

0 голосов
/ 23 июня 2010

Если вы согласны с использованием онлайнового API для этого, API в http://www.wisetrend.com/wisetrend_ocr_cloud.shtml может выполнять обнаружение текста в дополнение только к OCR.

...