Question

Я хочу иметь возможность сравнивать результаты, полученные при выполнении OCR для одного и того же документа три раза.Есть ли какие-нибудь инструменты, которые я могу использовать, чтобы это произошло?

Я хотел бы сравнить три документа и на основе того, какие символы совпадают в 3/3 или 2/3 раза, создать четвертый документ с выводом этого решения.Я использую Abby Fine Reader, который дал мне отличные результаты, но я стараюсь сделать все возможное, чтобы достичь 100%.

Я знаю, что в Microsoft Word есть функция «сравнить документы», и я хотел бы иметь возможность проводить такой анализ в более широком масштабе с помощью надежного алгоритма.

Есть идеи?

Спасибо за ваше время!

Computerish · Answer 1 · 17 декабря 2010

Если вывод представляет собой простой текстовый файл, вы можете использовать команду bash diff и простой сценарий оболочки для их сравнения. Возможно, вы могли бы затем использовать немного более сложный сценарий оболочки для анализа выходного файла и создания окончательного документа.

Многофункциональный механизм для повышения точности распознавания

Пожалуйста, войдите или зарегистрируйтесь чтобы ответить на этот вопрос.

1 Ответ

Пожалуйста, войдите или зарегистрируйтесь что бы добавить комментарий.

Многофункциональный механизм для повышения точности распознавания

Пожалуйста, войдите или зарегистрируйтесь чтобы ответить на этот вопрос.

1 Ответ

Пожалуйста, войдите или зарегистрируйтесь что бы добавить комментарий.

Похожие темы