Плохие результаты распознавания скриншотов тессеракт - PullRequest
0 голосов
/ 23 октября 2018

Я экспериментирую с PyTesseract для распознавания текста, полученного из других программ.Результаты на удивление плохие.Я подумал, что это простая проблема, учитывая, что распознавание отсканированных документов было довольно хорошим более 20 лет назад.

Например, для enter image description here Я получаю

"win32¢gui.EnumWindows(enum_cb, toplist)

winInfos = [(hwnd, title) for hwnd, title in winlist if
print("™sd process(es) found" % Len(winInfos))

wininfo = winInfos[@]

hwnd = wininfo[@]

# w2 = win32gui.Findwindow(None, “"Chrome")

for i in range(10):


eel eee"

Еще хуже без масштабирования и разных цветов фона и текста.

Мне не нужно идеальное решение (это скорее экспериментальный проект), но нужно хотя бы что-то адекватное.Я не ограничен многими способами, как реализовать / исправить это.Только ограниченное с Windows и Python также очень желательно.Я знаю Python более или менее и опыт в программировании в целом, но новичок в распознавании текста.

Тессеракт был первой библиотекой, которую я попробовал.Я прочитал это один из лучших.Я уже знаю, что ему нравятся большие шрифты (хотя для скриншотов, где все идентичные символы всегда выглядят одинаково, я думал, что высота в 8 пикселей вполне достаточна).И увидеть, как масштабирование и выравнивание всех фонов и цветов текста помогают, но не достаточно.Я собираюсь распознать содержимое таблиц с другим цветом текста и, возможно, фонов, поэтому было бы желательно не сталкиваться с такими вещами.

Пути решения, которые я вижу:

  • , чтобыувеличить шрифты в исходной программе, чтобы получить «истинное» более высокое разрешение (не уверен, что это поможет),
  • для обучения Тессеракта на моих шрифтах (быстрый поиск показал, что это очень скучно - инструкции с 20 шагами или с Pythonскрипты, которых у меня нет),
  • , чтобы попробовать другие библиотеки.

Что вы могли бы порекомендовать?

Спасибо

...