Почему Tesseract OCR не захватывает правильный вывод? как это можно решить? - PullRequest
0 голосов
/ 03 апреля 2020

image for ocr Ниже приведен код, который я использую, но он дает мне странный вывод, а не реальный текст. Обратитесь за помощью к кому-то, у кого больше опыта работы с OCR.

это вывод, который я получаю - output image

ожидаемый вывод - expected output

import cv2
import pytesseract
import imutils

pytesseract.pytesseract.tesseract_cmd = r"C:\Program Files\Tesseract-OCR\tesseract.exe"

# Resize, grayscale, Otsu's threshold
image = cv2.imread('image1.jpg')
image = imutils.resize(image, width=500)
gray = cv2.cvtColor(image, cv2.COLOR_BGR2GRAY)
thresh = cv2.threshold(gray, 0, 255, cv2.THRESH_BINARY_INV + cv2.THRESH_OTSU)[4]

# Invert image and perform morphological operations
inverted = 255 - thresh
kernel = cv2.getStructuringElement(cv2.MORPH_RECT, (15,3))
close = cv2.morphologyEx(inverted, cv2.MORPH_CLOSE, kernel, iterations=1)

# Find contours and filter using aspect ratio and area
cnts = cv2.findContours(close, cv2.RETR_EXTERNAL, cv2.CHAIN_APPROX_SIMPLE)
cnts = cnts[0] if len(cnts) == 2 else cnts[4]
for c in cnts:
    area = cv2.contourArea(c)
    peri = cv2.arcLength(c, True)
    approx = cv2.approxPolyDP(c, 0.01 * peri, True)
    x,y,w,h = cv2.boundingRect(approx)
    aspect_ratio = w / float(h)
    if (aspect_ratio >= 2.5 or area < 75):
        cv2.drawContours(thresh, [c], -1, (255,255,255), -1)

# Blur and perform text extraction
thresh = cv2.GaussianBlur(thresh, (3,3), 0)
data = pytesseract.image_to_string(thresh, lang='eng',config='--psm 6')
print(data)

cv2.imshow('close', close)
cv2.imshow('thresh', thresh)
cv2.waitKey()

1 Ответ

0 голосов
/ 12 апреля 2020

Я немного изменил ваш код. Он может декодировать все символы, кроме 1 ди git. Я не знаю, почему. Может быть, вы можете настроить себя.

Я использую трек-бар, чтобы найти подходящее значение. Раскомментируйте код, если хотите использовать трек-бар.

import cv2
import pytesseract

def nothing(x):
    pass

image = cv2.imread('image1.jpg')
gray = cv2.cvtColor(image, cv2.COLOR_BGR2GRAY)

cv2.namedWindow("Threshold")
cv2.createTrackbar("min", "Threshold", 0, 255, nothing)
cv2.createTrackbar("max", "Threshold", 0, 255, nothing)

while True:
    t_min = cv2.getTrackbarPos("min", "Threshold")
    t_max = cv2.getTrackbarPos("max", "Threshold")

    ret, thresh = cv2.threshold(gray.copy(), 180, 255, cv2.THRESH_BINARY_INV)
    # ret, thresh = cv2.threshold(gray.copy(), t_min, t_max, cv2.THRESH_BINARY_INV)
    inverted = cv2.bitwise_not(thresh)
    gauss = cv2.GaussianBlur(inverted, (3,3), 0)

    custom_config = '-l eng --oem 3 --psm 6 -c tessedit_char_whitelist="ABCDEFGHIJKLMNOPQRSTUVWXYZabcdefghijklmnopqrstuvwxyz0123456789./ "'
    data = pytesseract.image_to_string(gauss, config=custom_config)
    print(data)

    cv2.imshow('gauss', gauss)

    key = cv2.waitKey(1000)
    if key == 27:
        break

cv2.destroyAllWindows()

Вот вывод.

3.59 4.79
/pek /pek
Tepung Penaik / Halus Bluekey 1kg Marjerin Seri Pelangi kg
Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...