капча текстовое изображение извлечение - PullRequest
0 голосов
/ 04 июля 2019

В символе есть строка, которая затрудняет извлечение символа.

Что я уже пробовал:

import cv2
import pytesseract

pytesseract.pytesseract.tesseract_cmd = 'C:\\Program Files\\Tesseract-OCR\\tesseract.exe'
im_gray = cv2.imread('test/tlqkf10.png', cv2.IMREAD_GRAYSCALE)

(thresh, im_bw) = cv2.threshold(im_gray, 127, 255, cv2.THRESH_TRUNC | cv2.THRESH_OTSU)

chapNum4 = pytesseract.image_to_string(im_bw, lang='eng', config="-psm 8 -oem 3")

print(chapNum4)

Если вы удалите только линии, нарисованные на текстовом изображении, вы можете извлечь его.

enter image description here

...