Существует набор инструментов Tesseract OCR , представляющий собой механизм распознавания текста с открытым исходным кодом, который в настоящее время поддерживается Google. «Олипион» создал учебник по кросс-компиляции , чтобы войти в iPhone. Я бы сказал, что это хорошее место для начала.
Однако есть причины, по которым вы, возможно, не захотите использовать OCR на телефоне, даже если можете. Вот некоторые из них:
- Даже процессор нового iPhone 4 не такой быстрый, и, поскольку ваше приложение не может работать в фоновом режиме при выполнении обработки, взаимодействие с пользователем может быть неоптимальным.
- Запуск распознавания текста на мобильном устройстве, вероятно, будет убийственным для батареи.
- Каждый раз, когда вы захотите обновить механизм распознавания, каждый, кто установил ваше приложение, должен будет обновить.
Для всегда подключенного мобильного устройства, на котором где-нибудь работает OCR, возможно, будет лучше. Вы можете легко обновить программное обеспечение для оптического распознавания текста, использовать более мощные алгоритмы, чем мобильное устройство, и т. Д.
Я не настолько уверен, что вы сможете получить хорошие результаты от фотографий, сделанных с помощью мобильной камеры - точность систем оптического распознавания текста значительно снижается при использовании плохо освещенных, шумных, искаженных изображений, которые могут быть получены с камера телефона.
Что касается коммерческих продуктов, существует Evernote , который дает вам возможность распознавания, если вы покупаете их премиум-сервис.
В качестве альтернативы машинному распознаванию всегда есть Mechanical Turk , где вы можете заплатить небольшую сумму, чтобы сделать распознавание текста за вас. Вероятно, будет лучше при транскрипции, учитывая источник изображения.