Я использую MODI для чтения изображений и делаю то, что мне нужно сделать с текстом. Некоторые изображения работают нормально, а другие tiff-изображения всегда вызывают метод,
OCR (MODI.MiLANGUAGES.miLANG_ENGLISH, true, true)
потерпеть неудачу. Я исследовал это и попробовал различные варианты, такие как «ложь», «ложь» в списке параметров. Я также попробовал SYSDEFAULT вместо английского, но я все еще получаю ошибку. Может кто-нибудь сказать, пожалуйста, почему он не работает на некоторых изображениях TIFF, а не на других?
Я провел исследование и нашел ответ:
Одной из возможных причин является то, что MODI пытается обработать файл без распознаваемого текста. Пустой документ или документ, содержащий только рисунки / каракули и фактически пустой, вызовет это исключение.
Очевидно, что этого недостаточно, поскольку у меня нет приложения, которое решает распознавать одни изображения, а другие нет. Я обрабатываю исключение, но объект OCR тогда не инициализируется, поэтому я не могу делать то, что мне нужно оттуда.
Это кровавый кошмар! Почему метод не может сделать это просто кроваво, а если на изображении есть нечитаемые страницы, просто игнорируйте их?
Я использую Windows 7 Ultimate и Office 2007 Ultimate.
Версия Visual Studio - 2008
Спасибо,
IW