Извлечение текста из прямоугольника на экране Windows без использования OCR - PullRequest
0 голосов
/ 10 апреля 2019

Учитывая прямоугольник, представляющий область на экране Windows, которая содержит текст, каков наилучший способ извлечь текст?

Я знаю, что это возможно с помощью OCR, но даже после значительной предварительной обработки,качество действительно плохое.Получение текста окна с использованием Win32 API также не всегда работает.

Предполагая, что текст был отрисован с использованием шрифта, возможно ли получить его оттуда?Любые указания будут чрезвычайно полезны.Спасибо!

1 Ответ

1 голос
/ 10 апреля 2019

Учитывая прямоугольник, который представляет область на экране окна, лучший способ извлечь текст - это действительно OCR. Используйте лучшую библиотеку OCR, такую ​​как эта, от Microsoft .

Причина получения текста окна с помощью Win32 API не работает должным образом, потому что в этом прямоугольнике может быть несколько окон. Вам нужно будет выяснить, какие окна содержит прямоугольник, и отправить сообщение, чтобы получить текст для каждого окна. Это не невозможно, но сложно сделать, и даже если вам удастся это сделать, вы столкнетесь с проблемами выравнивания текста и т. Д. OCR - ваш лучший вариант.

Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...