Не могу найти тессдаты Tesseract 4.0 только для номеров - PullRequest
0 голосов
/ 30 ноября 2018

Как в этом посте: Pytesseract, использующий только числа tesseract 4.0, не работает Описано, возможно обнаруживать числа с помощью файла eng.traineddata, но если я хочу обнаружить только числа, это невозможно сэтот файл.Даже если вы определите tessedit_char_whitelist = 0123456789, он ничего не распознает.

  1. Я искал на GitHub и так далее, чтобы найти digit.traineddata для Tesseract 4.0, но не нашел?Кто-нибудь знает, какую я могу взять?
  2. Можно ли использовать одну из Tesseract 3.x (но там тоже ничего не нашли)
  3. Сложно ли тренировать свой собственный набор данных только с числамиЧто бы это сделать?
...