Как выполнить OCR для подмножества кадра камеры, используя Google TextRecognizer или Tesseract - PullRequest
0 голосов
/ 27 апреля 2019

Начиная с этого примера проекта [https://github.com/googlesamples/android-vision/tree/master/visionSamples/ocr-reader], я смог реализовать фильтрацию в методе OcrDetectorProcessor.receiveDetections().

Это работает, но com.google.android.gms.vision.text.TextRecognizer появляется для поиска по всему экрану символов.

Я предполагаю, что метод receiveDetections() можно было бы вызывать чаще, если бы меньшая часть экрана сканировалась на наличие символов вместо всего экрана.

Можно ли указать меньшую часть экрана для сканирования? Должно быть прямолинейно направить пользователя через чрезмерное изменение графического изображения расположить свою камеру так, чтобы это меньшая часть экрана содержала целевой текст, но я не уверен, как сказать процессору использовать только небольшую часть кадра при обработке OCR.

Что необходимо изменить, чтобы указать, что OCR должен работать на подмножестве кадра?

ДОПОЛНИТЕЛЬНАЯ ИНФОРМАЦИЯ:

Я попытался создать подкласс TextRecognizer, но он помечен final, и источник кажется закрытым.

Таким образом, я расширяю вопрос о том, как функциональность образца ocr-reader может быть воспроизведена с использованием Tesseract.

Я нашел эту ссылку , но не исследовал преобразование там концепций в кадры камеры, в отличие от одного файла изображения.

...