OCR (оптическое распознавание символов) для экранного текста - PullRequest
4 голосов
/ 22 мая 2009

Я пытаюсь создать программный продукт, который автоматизирует ПК, делая снимок экрана, а затем OCR (Оптическое распознавание символов) ищет определенную кнопку, которую нужно нажать (например). У меня есть часть управления мышью и клавиатурой, но теперь мне нужно было OCR для обработки скриншота. Что я обнаружил, так это то, что Tesseract OCR не очень хорошо работает с экранным текстом. Текст либо слишком мал, либо кажется, что часть текста связана, например K и X. Как мне это сделать?

p / s: для автоматической тестовой программы.

Ответы [ 2 ]

0 голосов
/ 24 июля 2009

Я не уверен, действительно ли это соответствует вашим требованиям, но некоторые из лучших оптических распознаваний, которые я видел в автоматизации, сделаны CitraTest от Tevron. В него включена библиотека шрифтов, и если набор шрифтов отсутствует, они создадут новый на основе ваших представлений. Отрицательными факторами этого инструмента будут стоимость и обычные проблемы, связанные с переменным разрешением экрана.

0 голосов
/ 22 мая 2009

Возможно, посмотрите на этот вопрос об улучшении изображения до распознавания текста. В остальном этот вопрос очень похож на "OCR for .NET" .

Если вы чувствуете себя по-настоящему смелым, вы всегда можете воспользоваться простым подходом на основе перцептрона или нейронной сети: -)

Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...