Исходя из вашего комментария, все, что вам нужно, это сканировать относительно небольшое количество документов с почти 100% точностью, а ваш бюджет составляет около 200 $
Ну, тогда ответ прост. Вам не нужно никакого программного решения. Просто купите качественный коммерческий продукт для оптического распознавания текста, т.е. ABBYY FineReader (отказ от ответственности: я работаю на ABBYY). У него разные цены в разных регионах, но я думаю, это где-то в вашем бюджете.
Коммерческий настольный продукт для оптического распознавания текста обеспечит вам практически 100% точность при работе с типичными языками. Также у них есть удобные инструменты ручной проверки, чтобы исправить все оставшиеся ошибки. Как правило, они поддерживают целый ряд современных шрифтов, но если ваш шрифт не тривиален, для них есть утилита для обучения шрифтов.
Я думаю, что это оптимальное решение для вас.
ОБНОВЛЕНИЕ: платформа Linux.
К сожалению, почти нет выбора высококачественных продуктов для оптического распознавания текста для Linux, извините. Единственное, что я знаю, это от ABBYY: http://ocr4linux.com/en:start, но оно не имеет интерфейса, проверки и обучения шрифтов. Но, по крайней мере, вы можете попытаться проверить, даст ли он достаточно хорошую точность, как это и может быть.