pytesseract для низкого разрешения img - PullRequest
0 голосов
/ 19 апреля 2020

Dis c: я набираю newb ie В OCR и ищу возможность конвертировать изображение в текст из изображения с низким разрешением image

Я пробовал pytesseract с разными conf, но все равно не удается преобразовать изображение в текст. Насколько я понимаю, мне нужна какая-то предварительная обработка перед отправкой изображения в тессеракт, я проверил некоторые варианты из связанных вопросов, но все еще не смог распознать текст с помощью pytesseract. Можно ли выполнить предварительную обработку или настройку тессеракта для успешного распознавания текста? Любые python примеры кода приветствуются, спасибо!

pytesseract.image_to_string(img, lang='eng')

PS У меня нет возможности повысить качество исходного изображения.

1 Ответ

0 голосов
/ 20 апреля 2020

Я могу использовать приведенный ниже код для распознавания изображения. Я думаю, что разрешение все еще разумно.

import cv2
import pytesseract

img = cv2.imread("NvhpY.png")
gray = cv2.cvtColor(img, cv2.COLOR_BGR2GRAY)
thresh = cv2.threshold(gray, 127, 255, cv2.THRESH_BINARY + cv2.THRESH_OTSU)[1]

custom_config = '-l eng --oem 3 --psm 6 '
data = pytesseract.image_to_string(thresh, config=custom_config)
print(data)

Результат

Kpekep
...