OCR (чтение текста с фотографий) в Какао? - PullRequest
3 голосов
/ 27 ноября 2010

Есть ли какой-нибудь код, который я могу использовать в Какао для распознавания текста с фотографий? Допустим, я делаю фотографию с iPhone на странице книги. Я хотел бы захватить текст в нем.

1 Ответ

8 голосов
/ 27 ноября 2010

Существует набор инструментов Tesseract OCR , представляющий собой механизм распознавания текста с открытым исходным кодом, который в настоящее время поддерживается Google. «Олипион» создал учебник по кросс-компиляции , чтобы войти в iPhone. Я бы сказал, что это хорошее место для начала.

Однако есть причины, по которым вы, возможно, не захотите использовать OCR на телефоне, даже если можете. Вот некоторые из них:

  • Даже процессор нового iPhone 4 не такой быстрый, и, поскольку ваше приложение не может работать в фоновом режиме при выполнении обработки, взаимодействие с пользователем может быть неоптимальным.
  • Запуск распознавания текста на мобильном устройстве, вероятно, будет убийственным для батареи.
  • Каждый раз, когда вы захотите обновить механизм распознавания, каждый, кто установил ваше приложение, должен будет обновить.

Для всегда подключенного мобильного устройства, на котором где-нибудь работает OCR, возможно, будет лучше. Вы можете легко обновить программное обеспечение для оптического распознавания текста, использовать более мощные алгоритмы, чем мобильное устройство, и т. Д.

Я не настолько уверен, что вы сможете получить хорошие результаты от фотографий, сделанных с помощью мобильной камеры - точность систем оптического распознавания текста значительно снижается при использовании плохо освещенных, шумных, искаженных изображений, которые могут быть получены с камера телефона.

Что касается коммерческих продуктов, существует Evernote , который дает вам возможность распознавания, если вы покупаете их премиум-сервис.

В качестве альтернативы машинному распознаванию всегда есть Mechanical Turk , где вы можете заплатить небольшую сумму, чтобы сделать распознавание текста за вас. Вероятно, будет лучше при транскрипции, учитывая источник изображения.

Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...