Тессеракт Тренинг на iPhone - PullRequest
2 голосов
/ 02 октября 2010

Я использую Tesseract в одном из своих приложений, и у меня возникают проблемы с получением отличных результатов.Когда я использую библиотеку на идеальном скриншоте, она получает большую часть текста, и это нормально.Но когда я использую его на фотографии, например, у него возникают проблемы с его обработкой, а иногда он даже ничего не возвращает.

Я знаю, что вы можете тренировать Тессеракт, есть хорошее учебное пособие или что-то для распознавания фотографий iPhone?Или я должен внести какие-либо изменения в исходное изображение перед его обработкой?

Спасибо!

1 Ответ

2 голосов
/ 02 октября 2010

Опубликовать образец рис.Вот несколько вещей, на которые стоит обратить внимание:

Как вы получаете изображение в 1-бит?В конечном счете, оптическое распознавание текста выполняется в черно-белых изображениях - возможно, вы можете сделать работу лучше, чем в библиотеке.

Что такое DPI изображения?Сканирование обычно составляет около 200-300 точек на дюйм, но фотографии могут быть 72 или 96. Механизмы распознавания обращаются к DPI, чтобы понять размер букв.Возможно, вам придется изменить DPI и изменить размер (изменить размер) изображения, чтобы DPI соответствовало ожиданиям.Механизмы оптического распознавания текста ожидают отсканированные документы, а не фотографии.

...