Как тренировать данные с помощью tenorflow ocr? - PullRequest
0 голосов
/ 22 апреля 2020

Я новичок в тензорном потоке, поэтому я немного запутался в тензорном потоке. Есть несколько моделей для выполнения OCR, таких как

  1. Внимание_ОК
  2. улица

У меня есть ниже документ, который я должен выполнить OCR. Я пытался использовать pytesseract для чтения изображения, но не дал должного результата. enter image description here

Мне нужен нижеприведенный результат на изображении выше

  • D MANIKANDAN

  • DURAISAMY

  • 16/07/1986

  • BNZPM2501F

Пожалуйста, предложите мне, пожалуйста, модальный тензор потока полезен для выполнения вышеописанного распознавания текста. Я использую приведенный ниже код для получения данных от pytesseract

def getData(coordinate, image):
    (y1, y2, x1, x2, classification) = coordinate
    ts = int(time.time())
    height = y2-y1
    width = x2-x1
    crop = image[y1:y1+height, x1:x1+width]
    CROP_IMAGE_URL = EXPORT_PATH +"data.jpg"
    cv2.imwrite(CROP_IMAGE_URL, crop)
    img = cv2.imread(CROP_IMAGE_URL)
    text = pytesseract.image_to_string(img)
    os.remove(CROP_IMAGE_URL)
    return text

Ответы [ 2 ]

1 голос
/ 22 апреля 2020

Шаги:

  • Обнаружение контуров.

  • После извлечения ROI на основе контура извлеките текст с помощью tesseract .


import cv2
import pytesseract
import matplotlib.pyplot as plt
import matplotlib

img = cv2.imread('pan2.jpg')
image= img.copy()
gray = cv2.cvtColor(image, cv2.COLOR_RGB2GRAY)
blur = cv2.GaussianBlur(gray, (3,3), 0)
thresh = 255 - cv2.threshold(blur, 0,255, cv2.THRESH_BINARY+cv2.THRESH_OTSU)[1]

# Dilate to combine adjacent text contours
kernel = cv2.getStructuringElement(cv2.MORPH_RECT, (4,2))
dilate = cv2.dilate(thresh, kernel, iterations=2)

# Find contours, highlight text areas, and extract ROIs
cnts = cv2.findContours(dilate, cv2.RETR_EXTERNAL, cv2.CHAIN_APPROX_SIMPLE)
cnts = cnts[0] if len(cnts) == 2 else cnts[1]

ROI_number = 0
ROI_images = []
for c in cnts:
    area = cv2.contourArea(c)
    x,y,w,h = cv2.boundingRect(c)
    if area > 1000 and 12<h<18:
        cv2.rectangle(image, (x, y), (x + w, y + h), (36,255,12), 3)
        ROI = img[y:y+h, x:x+w]
        # cv2.imwrite('ROI_{}.png'.format(ROI_number), ROI)
        ROI_number += 1
        ROI_images.append(ROI)
plt.subplot(131)
plt.imshow(thresh)
plt.subplot(132)
plt.imshow(dilate)
plt.subplot(133)
plt.imshow(image)
plt.show()

enter image description here


for i in ROI_images:
    text = pytesseract.image_to_string(i,config='--psm 10 --oem 3 -c tessedit_char_whitelist=0123456789')
    print("text:",text)
    plt.imshow(i)
    plt.show()

enter image description here

1 голос
/ 22 апреля 2020

Сначала вы должны создать модель обнаружения объекта, чтобы найти область интересов, как показано на рисунке. Затем вы можете передать изображение ROI в модель оптического распознавания символов или PyTesseract.

enter image description here

...