Многофункциональный механизм для повышения точности распознавания - PullRequest
2 голосов
/ 17 декабря 2010

Я хочу иметь возможность сравнивать результаты, полученные при выполнении OCR для одного и того же документа три раза.Есть ли какие-нибудь инструменты, которые я могу использовать, чтобы это произошло?

Я хотел бы сравнить три документа и на основе того, какие символы совпадают в 3/3 или 2/3 раза, создать четвертый документ с выводом этого решения.Я использую Abby Fine Reader, который дал мне отличные результаты, но я стараюсь сделать все возможное, чтобы достичь 100%.

Я знаю, что в Microsoft Word есть функция «сравнить документы», и я хотел бы иметь возможность проводить такой анализ в более широком масштабе с помощью надежного алгоритма.

Есть идеи?

Спасибо за ваше время!

1 Ответ

1 голос
/ 17 декабря 2010

Если вывод представляет собой простой текстовый файл, вы можете использовать команду bash diff и простой сценарий оболочки для их сравнения. Возможно, вы могли бы затем использовать немного более сложный сценарий оболочки для анализа выходного файла и создания окончательного документа.

Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...