Почему OCR (MODI.MiLANGUAGES.miLANG_ENGLISH, true, true) вызывает ошибку запуска OCR? - PullRequest
0 голосов
/ 07 июня 2010

Я использую MODI для чтения изображений и делаю то, что мне нужно сделать с текстом. Некоторые изображения работают нормально, а другие tiff-изображения всегда вызывают метод,

OCR (MODI.MiLANGUAGES.miLANG_ENGLISH, true, true)

потерпеть неудачу. Я исследовал это и попробовал различные варианты, такие как «ложь», «ложь» в списке параметров. Я также попробовал SYSDEFAULT вместо английского, но я все еще получаю ошибку. Может кто-нибудь сказать, пожалуйста, почему он не работает на некоторых изображениях TIFF, а не на других?

Я провел исследование и нашел ответ:

Одной из возможных причин является то, что MODI пытается обработать файл без распознаваемого текста. Пустой документ или документ, содержащий только рисунки / каракули и фактически пустой, вызовет это исключение.

Очевидно, что этого недостаточно, поскольку у меня нет приложения, которое решает распознавать одни изображения, а другие нет. Я обрабатываю исключение, но объект OCR тогда не инициализируется, поэтому я не могу делать то, что мне нужно оттуда.

Это кровавый кошмар! Почему метод не может сделать это просто кроваво, а если на изображении есть нечитаемые страницы, просто игнорируйте их? Я использую Windows 7 Ultimate и Office 2007 Ultimate.

Версия Visual Studio - 2008 Спасибо,

IW

1 Ответ

1 голос
/ 06 апреля 2011
OCR(MODI.MiLANGUAGES.miLANG_ENGLISH, true, true)

Вместо приведенного выше кода вы можете использовать

OCR(MODI.MiLANGUAGES.miLANG_ENGLISH, false, false)

потому что изображение tiff может быть 2400 * 2496.

...