Я предлагаю изменить размер. Я увеличил эту страницу до 200% в IE, сделал снимок экрана, распечатал его в PDF и импортировал в свою программу, которая использует tessnet. Тесс прибила это! Если я не прочитал #s неправильно: -)
Хотя достоверность = 140 (менее 100 предпочтительнее, если вам интересно). Конечно, когда я попробовал оригинальный размер, я не получил ~; Я получил около 1/2 правильных букв, кучу писем и прочую фигню. Не достаточно хорошо, но лучше.
t2, похоже, любит изображения определенного размера.
Моя программа выполняет обработку, чтобы заставить это работать. Предложите использовать .net GDI + для преобразования в 32-битные с изменением размера в режиме интерполяции High Quality Bicubic. Кажется, это немного «заполняет пробелы».
Играйте с размерами, которые работают - я обнаружил, что они слишком большие или слишком маленькие, и тессеракт работает по-другому.
Обе проблемы - это предварительная обработка, это просто, и вы бы попробовали, что попробует tesseract; однако я знаю, как изменить размер и интерполировать; Я не знаю, как распознать! Так что я готов поселиться.