Question

Я пытаюсь создать программный продукт, который автоматизирует ПК, делая снимок экрана, а затем OCR (Оптическое распознавание символов) ищет определенную кнопку, которую нужно нажать (например). У меня есть часть управления мышью и клавиатурой, но теперь мне нужно было OCR для обработки скриншота. Что я обнаружил, так это то, что Tesseract OCR не очень хорошо работает с экранным текстом. Текст либо слишком мал, либо кажется, что часть текста связана, например K и X. Как мне это сделать?

p / s: для автоматической тестовой программы.

Steven · Answer 1 · 24 июля 2009

Я не уверен, действительно ли это соответствует вашим требованиям, но некоторые из лучших оптических распознаваний, которые я видел в автоматизации, сделаны CitraTest от Tevron. В него включена библиотека шрифтов, и если набор шрифтов отсутствует, они создадут новый на основе ваших представлений. Отрицательными факторами этого инструмента будут стоимость и обычные проблемы, связанные с переменным разрешением экрана.

Matt Mitchell · Answer 2 · 22 мая 2009

Возможно, посмотрите на этот вопрос об улучшении изображения до распознавания текста. В остальном этот вопрос очень похож на "OCR for .NET" .

Если вы чувствуете себя по-настоящему смелым, вы всегда можете воспользоваться простым подходом на основе перцептрона или нейронной сети: -)

OCR (оптическое распознавание символов) для экранного текста

Пожалуйста, войдите или зарегистрируйтесь чтобы ответить на этот вопрос.

Ответы [ 2 ]

Пожалуйста, войдите или зарегистрируйтесь что бы добавить комментарий.

Пожалуйста, войдите или зарегистрируйтесь что бы добавить комментарий.

OCR (оптическое распознавание символов) для экранного текста

Пожалуйста, войдите или зарегистрируйтесь чтобы ответить на этот вопрос.

Ответы [ 2 ]

Пожалуйста, войдите или зарегистрируйтесь что бы добавить комментарий.

Пожалуйста, войдите или зарегистрируйтесь что бы добавить комментарий.

Похожие темы