Как объединить результаты нескольких инструментов OCR для лучшего распознавания текста - PullRequest
2 голосов
/ 27 марта 2019

Представьте себе, у вас есть разные инструменты OCR для чтения текста с изображений, но ни один из них не дает 100% -ной точности вывода.Однако в совокупности результат может быть очень близок к истинной истине - как лучше всего объединить текст, чтобы получить хорошие результаты?

Пример:

Фактический текст

§ 5.1: The contractor is obliged to announce the delay by 01.01.2019 at the latest. The identification-number to be used is OZ-771LS.

Инструмент OCR 1

5 5.1 The contractor is obliged to announce the delay by O1.O1.2019 at the latest. The identification-number to be used is OZ77lLS.

Инструмент OCR 2

§5.1: The contract or is obliged to announce theedelay by 01.O1. 2O19 at the latest. The identification number to be used is O7-771LS

Инструмент OCR 3

§ 5.1: The contractor is oblige to do announced he delay by 01.01.2019 at the latest. T he identification-number ti be used is OZ-771LS.

Что может быть многообещающим алгоритмом дляслить OCR 1, 2 и 3, чтобы получить реальный текст?

Моей первой идеей было создание «падающего окна» произвольной длины, сравнить слова в окне и взять слова 2 из 3 инструментов прогнозирования.для каждой позиции.

Например, с размером окна 3:

[5 5.1 The] 
[§5.1: The contract] 
[§ 5.1: The] 

Как видите, алгоритм не работает, поскольку все три инструмента имеют разных кандидатов на первую позицию (5, §5.1: и §).

Конечно, было бы возможно добавить некоторые уловки, такие как расстояние Левенштейна, чтобы допустить некоторые отклонения, но я боюсь, что это не будет достаточно надежным.

Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...