Как эффективно предварительно обработать изображение для распознавания текста с помощью tesseract? - PullRequest
0 голосов
/ 06 августа 2020

Как повысить точность распознавания символов. ниже - изображение и код.

Входное изображение

Изображение после установки порога

код:


rcz = cv2.resize(img, dsize, fx=1, fy=1, interpolation=cv2.INTER_AREA)

gray = cv2.cvtColor(rcz, cv2.COLOR_BGR2GRAY)

bl = cv2.bilateralFilter(gray,9,5,5)

th = cv2.threshold(bl, 0, 255, cv2.THRESH_BINARY + cv2.THRESH_OTSU)[1]

text = pytesseract.image_to_string(th)

вывод:

5 8EM TD C ECO M *

2018

(ноябрь)

ЭКОНОМИКА (Major) Курс: 504 (Денежная теория и финансовый рынок} Полная оценка: 80 Пройденных оценок: 32/24 Время: 3 часа ”

Цифры на полях показывают полные оценки за вопросы

  1. Выберите правильный вариант / Ответьте следующее: 1 * 8 = 8 fa) Согласно RBI, M2 состоит из

(j M, + все депозиты почтового отделения

(ii) M , + срочные вклады коммерческих банков 5

Ppo / ase (Tusn Ower}

...