Тессеракт 3.05 проблема с курсивными шрифтами - PullRequest
0 голосов
/ 15 октября 2018

Итак, я пытаюсь тренировать tesseract 3.05 на действительно курсивных шрифтах.

Некоторые из моих шрифтов Hogarth Script EF Regular , Balmoral , Office Script DT Alternate Bold и т. Д., И все они всес соединенными буквами, но проблема в том, что когда я тестирую изображение на обученной модели, со всеми соединенными буквами (как показано ниже), tesseract, кажется, не распознает одну букву (изображение соединенных букв), но когда я проверяю изображение с разнесенными вручную буквами, оно почти распознает все слово (как показано ниже) (изображение с разнесенными буквами)

Есть ли способ, которым я могувыполнить некоторую обработку изображения на изображении, прежде чем я проверю его на tesseract, или, может быть, что-то изменим в процессе обучения, чтобы оно распознало само слово по картинке?

...