Проблема Тессеракта со стадией mftraining - PullRequest
3 голосов
/ 23 февраля 2011

Я успешно создал файл коробки с tesseract
теперь после запуска unicharset_extractor
создание файла unicharset, который выглядит следующим образом:

...
n 3 NULL -1
s 3 NULL 23
t 3 NULL 43
...

Я продолжил эту команду

mftraining -U unicharset -O testlang.unicharset testlang.tr

только для получения следующей ошибки

Reading testlang.tr ...
testlang has no defined properties.

Error: Illegal short name for a feature!

1 Ответ

0 голосов
/ 01 марта 2011

Я никогда не работал с Tesseract, но, похоже, в базе данных ошибок есть открытая проблема, которая очень похожа на вашу проблему: http://code.google.com/p/tesseract-ocr/issues/detail?id=385

Похоже, что это связано с тем, что некоторые функции неправильно поддерживают научную запись.

На странице проблемы пользователь предлагает решение, а другой предлагает исправление. Вы можете попробовать применить патч, чтобы посмотреть, поможет ли он.

...