Я пытаюсь создать программный продукт, который автоматизирует ПК, делая снимок экрана, а затем OCR (Оптическое распознавание символов) ищет определенную кнопку, которую нужно нажать (например). У меня есть часть управления мышью и клавиатурой, но теперь мне нужно было OCR для обработки скриншота. Что я обнаружил, так это то, что Tesseract OCR не очень хорошо работает с экранным текстом. Текст либо слишком мал, либо кажется, что часть текста связана, например K и X. Как мне это сделать?
p / s: для автоматической тестовой программы.