Улучшение результатов Tesseract на Android - PullRequest
1 голос
/ 15 марта 2012

Я разрабатывал приложение для Android, в котором используется тессерактное оптическое распознавание символов (TCR), и мне было интересно, есть ли способ улучшить результаты для мелкого текста.

Я попытался пересобрать стандартный словарь с моими собственными частыми и обычными списками слов (используя wordlist2dawg) и не увидел улучшения (я даже не могу сказать, помогает ли это!). Я также слышал, что можно изменить порог, при котором tesseract использует словарные слова, но я не знаю, как это сделать.

Если у кого-нибудь есть представление о том, как я могу улучшить результаты, которые дает мне тессеракт, я был бы очень признателен!

1 Ответ

3 голосов
/ 15 марта 2012

Мне известны некоторые параметры, которые могут вам помочь:

  1. Добавить дополнительное пространство между рамкой изображения и текстом.Тессеракт будет работать ужасно, если текст на изображении будет располагаться по краю.
  2. Дублируйте ваше изображение.Например, если вы выполняете OCR над словом «foobar», клонируйте изображение и отправьте «foobar foobar foobar foobar foobar» в tesseract, результаты будут лучше.
  3. Google для обучения шрифтов и бинаризации изображений дляtesseract.

Имейте в виду, что встроенные в мобильные устройства камеры в основном производят изображения низкого качества (размытые, с шумом, искаженные и т. д.). Сам по себе распознавание текста - это процесс, требующий значительных ресурсов, и если вы добавите достойное изображениеПредварительная обработка изображения для этого, низкоуровневые и средние мобильные устройства (которые могут иметь Android) могут столкнуться с неожиданно низкой производительностью или даже нехваткой ресурсов.Это нормально для бесплатных / учебных проектов, но если вы планируете коммерческое приложение - рассмотрите возможность использования лучшего SDK.

Посмотрите на этот вопрос для деталей: OCR для Android

...