Я экспериментирую с PyTesseract для распознавания текста, полученного из других программ.Результаты на удивление плохие.Я подумал, что это простая проблема, учитывая, что распознавание отсканированных документов было довольно хорошим более 20 лет назад.
Например, для
Я получаю
"win32¢gui.EnumWindows(enum_cb, toplist)
winInfos = [(hwnd, title) for hwnd, title in winlist if
print("™sd process(es) found" % Len(winInfos))
wininfo = winInfos[@]
hwnd = wininfo[@]
# w2 = win32gui.Findwindow(None, “"Chrome")
for i in range(10):
eel eee"
Еще хуже без масштабирования и разных цветов фона и текста.
Мне не нужно идеальное решение (это скорее экспериментальный проект), но нужно хотя бы что-то адекватное.Я не ограничен многими способами, как реализовать / исправить это.Только ограниченное с Windows и Python также очень желательно.Я знаю Python более или менее и опыт в программировании в целом, но новичок в распознавании текста.
Тессеракт был первой библиотекой, которую я попробовал.Я прочитал это один из лучших.Я уже знаю, что ему нравятся большие шрифты (хотя для скриншотов, где все идентичные символы всегда выглядят одинаково, я думал, что высота в 8 пикселей вполне достаточна).И увидеть, как масштабирование и выравнивание всех фонов и цветов текста помогают, но не достаточно.Я собираюсь распознать содержимое таблиц с другим цветом текста и, возможно, фонов, поэтому было бы желательно не сталкиваться с такими вещами.
Пути решения, которые я вижу:
- , чтобыувеличить шрифты в исходной программе, чтобы получить «истинное» более высокое разрешение (не уверен, что это поможет),
- для обучения Тессеракта на моих шрифтах (быстрый поиск показал, что это очень скучно - инструкции с 20 шагами или с Pythonскрипты, которых у меня нет),
- , чтобы попробовать другие библиотеки.
Что вы могли бы порекомендовать?
Спасибо