Происходит текст приложения (не отсканировано, НЕ проверено) - PullRequest
2 голосов
/ 28 апреля 2011

Я бы хотел связать приложение с приложением, прочитав отображаемый текст.

Я добился успеха в некоторых приложениях, когда Windows не выполняет сглаживание шрифтов, набирая фразу вручную, отображая ее во всех шрифтах Windows и находя совпадение - оттуда я могу сопоставить изображение каждой буквы букве генерируя все буквы шрифта.

Это не будет работать, если выполняется какое-либо сглаживание шрифтов, как Windows, так и приложением. Каково современное состояние распознавания компьютерного текста? Кажется, что это должно быть проще, чем разбивать CAPTCHA или OCRing отсканированный текст. Где я могу найти ресурсы об этом? Пока я нашел только статьи о взломе CAPTCHA или распознавании отсканированного текста.

Я предпочитаю решения, легко доступные из Python, хотя, если в каком-то другом языке есть хороший вариант, я сделаю работу по его интерфейсу.

1 Ответ

1 голос
/ 28 апреля 2011

Я не совсем уверен, что вы имеете в виду, но я думаю, что простое чтение текста с помощью программы OCR подойдет.

Тессеракт удивительно точен для отсканированных документов, поэтому конкретный шрифт будет проще простогодля этого читать.Вот мое решение Python OCR: Модуль Python OCR в Linux? .

Но вы могли бы сгенерировать каждый символ в виде изображения и найти места на изображении.Это (может) сработает, но я понятия не имею, насколько точным было бы это сглаживание.

...