Question

Я экспериментирую с PyTesseract для распознавания текста, полученного из других программ.Результаты на удивление плохие.Я подумал, что это простая проблема, учитывая, что распознавание отсканированных документов было довольно хорошим более 20 лет назад.

Например, для Я получаю

"win32¢gui.EnumWindows(enum_cb, toplist)

winInfos = [(hwnd, title) for hwnd, title in winlist if
print("™sd process(es) found" % Len(winInfos))

wininfo = winInfos[@]

hwnd = wininfo[@]

# w2 = win32gui.Findwindow(None, “"Chrome")

for i in range(10):


eel eee"

Еще хуже без масштабирования и разных цветов фона и текста.

Мне не нужно идеальное решение (это скорее экспериментальный проект), но нужно хотя бы что-то адекватное.Я не ограничен многими способами, как реализовать / исправить это.Только ограниченное с Windows и Python также очень желательно.Я знаю Python более или менее и опыт в программировании в целом, но новичок в распознавании текста.

Тессеракт был первой библиотекой, которую я попробовал.Я прочитал это один из лучших.Я уже знаю, что ему нравятся большие шрифты (хотя для скриншотов, где все идентичные символы всегда выглядят одинаково, я думал, что высота в 8 пикселей вполне достаточна).И увидеть, как масштабирование и выравнивание всех фонов и цветов текста помогают, но не достаточно.Я собираюсь распознать содержимое таблиц с другим цветом текста и, возможно, фонов, поэтому было бы желательно не сталкиваться с такими вещами.

Пути решения, которые я вижу:

, чтобыувеличить шрифты в исходной программе, чтобы получить «истинное» более высокое разрешение (не уверен, что это поможет),
для обучения Тессеракта на моих шрифтах (быстрый поиск показал, что это очень скучно - инструкции с 20 шагами или с Pythonскрипты, которых у меня нет),
, чтобы попробовать другие библиотеки.

Что вы могли бы порекомендовать?

Спасибо

Плохие результаты распознавания скриншотов тессеракт

Пожалуйста, войдите или зарегистрируйтесь чтобы ответить на этот вопрос.

Ответы [ 0 ]

Плохие результаты распознавания скриншотов тессеракт

Пожалуйста, войдите или зарегистрируйтесь чтобы ответить на этот вопрос.

Ответы [ 0 ]

Похожие темы