анализ файла jpg для извлечения информации / текста - PullRequest
1 голос
/ 25 июня 2010

У меня есть идея для проекта, на который я хотел бы дать несколько советов / указателей.

Я планирую написать приложение для автоматического разбора квитанций о расходах в формате JPG и автоматического извлечения суммы, а также классификации по некоторому алгоритму обучения. Это вообще выполнимо? Какие библиотеки доступны для анализа файлов jpg для извлечения из него текстовой информации и информации о валюте?

Любые указатели оценены ... У меня есть ванильный HP все в одном сканере, который я буду использовать для сканирования всех чеков.

Спасибо RS

1 Ответ

1 голос
/ 25 июня 2010

Вам понадобится модуль OCR (Оптическое распознавание символов), который распознает и извлекает текст из изображений.Прошло много времени с тех пор, как я в последний раз использовал программное обеспечение OCR, не зная, какие сейчас лучшие SDK / плагины.

Я нашел статью о Проекте кода , в котором используется продукт оптического распознавания символов Leadtool .

...