В Tesseract Ocr обучение с различными типами шрифтов приведет к снижению скорости распознавания, как ее решить - PullRequest
0 голосов
/ 20 ноября 2018

Если это тот же тип цифрового шрифта (например, чёрное тело), ​​только тренировка этого типа распознавания шрифтов очень высока, если я добавлю другие типы шрифтов (например, тонкие шрифты, около 10 типов), обучение приведет к снижению скорости признания. Как можно объединить разные типы шрифтов для обучения, не снижая скорость распознавания?

Один метод состоит в том, чтобы обучать различные типы шрифтов отдельно, и, наконец, использовать знак + для подключения, чтобы идентифицировать файл (например, eng + num + num2 + num3), но это приведет к снижению скорости распознавания.

Есть ли другой способ решить эту проблему? Я хочу тренировать только один файл, не используя слишком много обучающих файлов.

...