Так что мой текущий личный проект - это возможность автоматически получать скриншоты из игры, распознавать текст и подсчитывать количество вхождений заданных слов.
Проведя весь вечер, рассматривая различные решения для оптического распознавания символов, я пришел к выводу, что большинство пакетов оптического распознавания текста предназначены для сканированного текста. Если есть какие-либо пакеты, которые могут надежно читать текст на экране, они находятся за пределами бюджета этого любителя.
Я перечитывал некоторые другие вопросы, и самым близким, что я нашел, было Механизмы распознавания текста, предназначенные для чтения с экрана .
Мне кажется, что чтение отрендеренного текста должно быть намного проще, чем печатный и отсканированный текст. Линии всегда прямые, и любая данная буква всегда будет отображаться с одинаковым пиксельным представлением (в основном, в любом случае). Кроме того, почему бы не использовать фактический файл шрифта (если он у вас есть) как шпаргалку для распознавания символов? С такой системой мы могли бы достичь 100% точности.
Если у вас есть файл шрифта для шпаргалки, а исходное изображение идеально квадратное и не имеет шумов, как бы вы узнали о распознавании символов на экране?
(Проблемы, которые я могу предвидеть, - это линии и изображения пользовательского интерфейса, которые могут запутать любую грубую попытку угадывания пикселей.)
Если вы уже знаете о бесплатном OCR-пакете с открытым исходным кодом, предназначенном для чтения с экрана, пожалуйста, дайте мне знать. Хотя я и сомневаюсь, что это проявится, так как другие спрашивающие, похоже, тоже не получили преимущество.
Предпочтителен интерфейс Python, но у нищих нет выбора.
EDIT:
Чтобы уточнить, я ищу конструктивные предложения для решения OCR, которое специально разработано для чтения текста со скриншотов. Популярные инструменты, такие как tesseract (упомянутый в связанном вопросе), в лучшем случае сложны в использовании, поскольку они не предназначены для такого типа исходного файла.