Как исправить текст после обработки OCR - PullRequest
0 голосов
/ 08 ноября 2018

У меня есть задача, которая должна исправить OCR после обработанного текста. допустим, что текст, обработанный при помощи OCR, содержит дату в формате 01-1B-20J8 (формат MM-DD-YYYY) (входные данные представлены в формате String). мой вывод должен быть список возобновленных дат (01-18-2018, 01-16-2018). Как это можно сделать в Python? Я на самом деле планирую построить словарь Python на основе моей интуиции, как это

dict= {'a':[0,9],'b':[6],'d':[9],'g':[9],'i':[1],'j':[1],'l':[1],'o':[0], 'p':[9],'q':[9],'s':[5],'z':[2],'B':[6,8],'C':[6],'D':[0,6],'E':[3],'G':[6], 'J':[1],'O':[0],'P':[9],'Q':[8],'S':[5]}

def post_processing_date(text ,type,format):

# if (дата не содержит алфавитов, возвращающих фактическую дату) else (вернуть предложенный вывод, заменив алфавиты значениями в словаре)

, пожалуйста, предложите мне какой-нибудь лучший метод, чем этот. Есть библиотека Python, которая может автоматически исправлять текст, обработанный OCR.

Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...