Как улучшить скорость и точность распознавания Tesseract / Tessnet2? - PullRequest
4 голосов
/ 14 сентября 2011

Я видел, что для ограничения ошибок сканирования вы можете определить белый список символов.

Но я не смог найти информацию для bool numericMode в ocr.Init(@"c:\temp", "fra", false);

Предположим, вы хотите сканировать только цифры: Установка белого списка в «0123456789» будет правильным для получения наилучших результатов распознавания, но что делает параметр numericMode метода Init? Я всегда считал это ложным, даже когда белый список был "0123456789".

Кроме того, каковы наилучшие параметры растрового изображения (пиксельный формат) для изображения, передаваемого в tessnet.

Ответы [ 2 ]

1 голос
/ 31 июля 2012

Опыт показывает, что числовой режим ограничивает результаты цифрами и вспомогательными символами. Я видел "0123456789,. + - / *% <> $ () {}" и многое другое. Символы валюты допускаются.

Кроме того, исходя из своего опыта, я не видел большого преимущества форматов с уменьшенной глубиной цвета по сравнению с полноцветным изображением. Однако я не оптимизировал скорость, только точность. Если ваши шрифты маленькие (строчные буквы> = 8 пикселей в высоту), то увеличение изображения может действительно повысить точность.

1 голос
/ 29 сентября 2011

Вопрос о сканировании чисел указан в Tesseract FAQ . Если у вас версия 3, вы можете просто выполнить команду:

tesseract image.tif outputbase nobatch digits
...