Как распознать текст с изображения с помощью pytesseract - PullRequest
0 голосов
/ 23 апреля 2019

pytesseract не извлекает текст из шумовых изображений.

Я пытаюсь извлечь текст из изображений с помощью pytesseract.pytesseract хорошо показал себя на некоторых изображенияхЯ применил следующие методы предварительной обработки.

img = cv2.imread('crop.jpg', 0)
blur = cv2.medianBlur(img, 5)
kernel = np.ones((1, 1), np.uint8)
dilate = cv2.dilate(img, kernel, iterations=5)
erode = cv2.erode(dilate, kernel, iterations=5)
img = cv2.threshold(cv2.GaussianBlur(erode, (5, 5), 0), 0, 255, cv2.THRESH_BINARY + cv2.THRESH_OTSU)[1]

pytesseract.image_to_string(crop)

Извлечь текст из изображения:

enter image description here

...