Доступен ли какой-либо открытый стандарт результатов OCR, не привязанный к какому-либо поставщику API OCR? - PullRequest
0 голосов
/ 28 мая 2020

Я ищу, чтобы определить, существует ли открытый стандарт для результата операции OCR.

В настоящее время каждый поставщик OCR API ex. Azure API компьютерного зрения Google Cloud Vision API AWS Textract Имеет уникальный результат OCR, который обычно состоит из иерархии страниц, строк, слов соответственно.

Проблема, которую я вижу, если это, если инструмент создается, который использует результаты OCR, если он создается с указанием платформы / поставщика c результат OCR, он привязан к этому контракту результата от этого указанного c поставщика.

Я надеюсь обнаружить следующее:

  1. Существуют веские аргументы в пользу открытого стандарта для результатов OCR
  2. Есть веские аргументы в пользу сохранения Спецификация платформы c Результаты распознавания текста из-за существующих инструментов, основанных на контрактах / схеме данных.

Надеюсь, этот вопрос имеет смысл.

Как инженеры решают проблему использования результатов OCR от разных провайдеров? Возможно, кто-то хотел бы избежать риска привязки к какому-либо одному поставщику и вместо этого иметь возможность использовать любого?

У меня есть мысль, что, возможно, существует человеческий инструмент пользовательского интерфейса, который позволяет человеку просматривать результаты OCR вместе с исходным документом. Свяжется ли этот инструмент с конкретным контрактом данных платформы c?

...