, если вы используете tesseract 3 (который, я полагаю, вы используете).Вам придется пересобрать ваш файл eng.trainddata, который я намеревался полностью заменить файл word-dawg, чтобы попытаться получить лучшие результаты (т.е. слова, которые я обнаруживаю, всегда одинаковы).
you 'Когда вы скомпилируете tesseract, вам потребуются исполняемые файлы combinite_tessdata и wordlist2dawg в каталоге обучения.
распакуйте все (я сделал это только для резервного копирования моего eng.word-dawg, вам также понадобитсяunicharset позже)
. / объединение_стессдат -u eng.traineddata
создать текстовый файл вашего списка слов (wordlistfile)
создать eng.word-dawg
. / Wordlist2dawg wordlistfile eng.word-dawg trainingdat_backup / .unicharset
замените файл word-dawg
. / comb_tessdata -o eng.traineddata eng.word-dawg
, который должен быть этим.