Оцениваете выходной сигнал другого механизма распознавания? (ABBYY, TESSERACT, SOLID, Microsoft VISION) - PullRequest
1 голос
/ 30 сентября 2019

Ввод - PDF-файлы (отсканированные или PDF-файлы)

Я пытаюсь оценить использование многих механизмов распознавания. Я пробовал несколько механизмов OCR, таких как SOLID, ABBYY, Tesseract, Microsoft Vision и т. Д., Но я не могу найти общий показатель для оценки того же.


Как, например,

Как оценить выходное значение OCR?


ЧтоЯ пробовал: -

Первоначально я пытался использовать простую метрику оценки, например, определить, были ли слова, которые были обработаны из OCR, частью большего словаря, такого как 'словарь GLOVE из 8B слов. Просто простая метрика оценки.

Но это не может быть единственным фактором, определяющим, является ли документ хорошего качества или нет. Это не будет контекстно-ориентированный подход.

Я также пытался предположить, что некоторые документы, которые уже в формате docx, имеют превосходное качество, чтобы я мог построить модель языка из него.

Таким образом, для нового документа, который входит, для каждого слова и использования его в качестве метки, я мог бы определить, будет ли моя языковая модель предсказывать это слово (или в его верхних n вероятностях).

Я не могу представить, как можно оценить результаты распознавания? Надеемся ли мы просто на постобработку или мы можем что-то сделать и в отношении классификации изображений?


Справочные документы

Я также ссылался на эти документы:

  1. https://ryanfb.github.io/etc/2015/03/16/automatic_evaluation_of_ocr_quality.html
  2. https://link.springer.com/article/10.1007/s11042-016-4185-5
  3. http://citeseerx.ist.psu.edu/viewdoc/download;jsessionid=F09C111226D5C362034EED5614A7E92A?doi=10.1.1.81.8901&rep=rep1&type=pdf
  4. https://www.hsassocs.com/what-is-ocr-accuracy/
Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...