Pytesseract не распознает текст, как ожидалось - PullRequest
0 голосов
/ 03 мая 2020

Я делаю проект, используя OCR. Я хочу прочитать текст из pi c. Я использую tesseract для OCR, для получения лучших результатов я добавил код улучшения изображения. Но результаты в OCR являются средними до обработки изображения, после предварительной обработки результата нет. Я буду рад, если кто-нибудь поможет. Проект планирования приема таблеток (редактируемый)

1 Ответ

0 голосов
/ 03 мая 2020

Я думаю, вы должны научить тессеракт распознавать ваш почерк. Используя данные об акциях, вот что я получил.

import cv2
import pytesseract

img = cv2.imread("input2.jpeg", cv2.IMREAD_GRAYSCALE)
img = cv2.resize(img, None, fx=0.3, fy=0.3)
thresh = cv2.threshold(img, 127, 255, cv2.THRESH_BINARY)[1]
gauss = cv2.GaussianBlur(thresh, (3, 3), 0)

custom_config = r'-l eng --oem 3 --psm 6 '
text = pytesseract.image_to_string(gauss, config=custom_config)
print("detected: " + text)

cv2.imshow("img", img)
cv2.imshow("thresh", thresh)
cv2.imshow("gauss", gauss)

cv2.waitKey(0)
cv2.destroyAllWindows()

Результат

detected: \We Staet With Good
Gecause all businesses should
be doing Something good .
...