Возможно ли распознавание номера на iPhone в режиме реального времени? - PullRequest
9 голосов
/ 03 февраля 2011

Мне нужно распознать числа с изображения с камеры на iPhone в режиме реального времени. Я знаю, что на изображении будет не более 5 цифр.

Реально ли решить эту проблему, учитывая вычислительные характеристики iPhone? У кого-нибудь есть опыт использования библиотеки оптического распознавания текста Tesseract, и думаете ли вы, что ее можно решить, используя ее?

Ответы [ 5 ]

11 голосов
/ 03 февраля 2011

Зависит от вашего определения «в реальном времени», но да, должна быть возможность относительно быстрого распознавания цифр 0-9 на iPhone 4, особенно если вы можете использовать шрифты, условия освещения и т. Д.что они появятся.

Я настоятельно рекомендую прочитать статью на о том, как Sudoku Grab распознает головоломки с помощью камеры iPhone.В их случае для идентификации цифр использовалась обученная нейронная сеть, которая должна быть достаточно простой и быстрой на современном оборудовании iOS.

Современные библиотеки распознавания, такие как OpenCV, будут использовать процессор iPhone для выполнения операций.обработка.Я слышал, что они могут выполнять даже более сложные задачи, такие как распознавание лиц, достаточно быстро, чтобы использовать их с видеоисточниками, демонстрируя при этом минимальное заикание.

Для еще более высокой производительности, я считаю, что есть большой потенциал впрограммируемые графические процессоры на новых устройствах iOS.В моих тестах я увидел ускорение в 14–28 раз при использовании графического процессора iPhone 4 для простой обработки изображений.В то время как немногие люди смотрят на это прямо сейчас, что-то вроде нейронной сети Судоку Граб должно быть достаточно параллельным процессом, чтобы извлечь выгоду из работы на GPU.

1 голос
/ 06 июня 2017

Для этого есть бесплатный SDK: http://rtrsdk.com/ Поддерживает iOS и Andorid, работает в режиме реального времени, помогает захватывать любой текст, цифры не должны быть проблемой.

Отказ от ответственности: я работаю на ABBYY

1 голос
/ 13 сентября 2011

ДА, возможно использование двигателя Тессеракт

Вот пример кода, если вы хотите проверить ...

https://github.com/nolanbrown/Tesseract-iPhone-Demo

1 голос
/ 03 февраля 2011

Это должно быть возможно в вычислительном отношении.Есть приложения, которые могут получить штрих-код в режиме реального времени, а также приложение, которое выполняет перевод в режиме реального времени.(Слово Объектив).Однако я не уверен, какие библиотеки они используют.

0 голосов
/ 05 июня 2017

Да. Бендер может помочь вам в этом.Это позволяет создавать и запускать нейронные сети на iOS.Поскольку он использует металл под капотом, он работает быстро и плавно.Он также поддерживает прямой запуск моделей TensorFlow.

Таким образом, вы можете запустить в Bender существующую модель в TensorFlow, обученную распознаванию цифр Распознавание рукописных цифр с использованием сверточных нейронных сетей в Python с Keras , если вам нужна помощь

Отказ от ответственности: я работал над этим проектом.

...