Представьте себе, у вас есть разные инструменты OCR для чтения текста с изображений, но ни один из них не дает 100% -ной точности вывода.Однако в совокупности результат может быть очень близок к истинной истине - как лучше всего объединить текст, чтобы получить хорошие результаты?
Пример:
Фактический текст
§ 5.1: The contractor is obliged to announce the delay by 01.01.2019 at the latest. The identification-number to be used is OZ-771LS.
Инструмент OCR 1
5 5.1 The contractor is obliged to announce the delay by O1.O1.2019 at the latest. The identification-number to be used is OZ77lLS.
Инструмент OCR 2
§5.1: The contract or is obliged to announce theedelay by 01.O1. 2O19 at the latest. The identification number to be used is O7-771LS
Инструмент OCR 3
§ 5.1: The contractor is oblige to do announced he delay by 01.01.2019 at the latest. T he identification-number ti be used is OZ-771LS.
Что может быть многообещающим алгоритмом дляслить OCR 1, 2 и 3, чтобы получить реальный текст?
Моей первой идеей было создание «падающего окна» произвольной длины, сравнить слова в окне и взять слова 2 из 3 инструментов прогнозирования.для каждой позиции.
Например, с размером окна 3:
[5 5.1 The]
[§5.1: The contract]
[§ 5.1: The]
Как видите, алгоритм не работает, поскольку все три инструмента имеют разных кандидатов на первую позицию (5, §5.1: и §).
Конечно, было бы возможно добавить некоторые уловки, такие как расстояние Левенштейна, чтобы допустить некоторые отклонения, но я боюсь, что это не будет достаточно надежным.