Question

Я хотел бы получить от изображения в группах, которые находятся на изображении

Мне удалось удалить первый контур (как описано ниже), но проблема в том, что, когда я пытаюсь прочитать текст, у меня есть какой-то пропущенный текст, я ожидаю, что это из-за других контуров, которые остались на изображении, но пока я пытаюсь их удалить, я теряю группировку или часть текста ...

for i in range(len(contours)):
   if 800 < cv2.contourArea(contours[i]) < 2000:
        x, y, width, height = cv2.boundingRect(contours[i])
        roi = img[y:y + height, x:x + width]
        roi_h = roi.shape[0]
        roi_w = roi.shape[1]
        resize_roi = cv2.resize(roi,(int(roi_w*6),int(roi_h*6)), interpolation=cv2.INTER_LINEAR)
        afterd = cv2.cvtColor(resize_roi, cv2.COLOR_BGR2GRAY)
        retim, threshm = cv2.threshold(afterd, 210, 225, cv2.THRESH_BINARY + cv2.THRESH_OTSU)
        contoursm, hierarchym = cv2.findContours(threshm, cv2.RETR_TREE, cv2.CHAIN_APPROX_SIMPLE)
        mask = np.ones(resize_roi.shape[:2], dtype="uint8") * 255
        for m in range(len(contoursm)):
             if 10000 < cv2.contourArea(contoursm[m]) < 33000:
                  cv2.drawContours(mask, contoursm, m, 0, 7)
                  afterd = cv2.bitwise_not(afterd)
                  afterd = cv2.bitwise_and(afterd, afterd, mask=mask)
                  afterd = cv2.bitwise_not(afterd)
                  print(pytesseract.image_to_string(afterd, lang='eng', config='--psm 3'))

Rotem · Answer 1 · 15 марта 2020

Вместо того, чтобы иметь дело со всеми полями, я предлагаю удалить их, найдя подключенные компоненты, и залить большие кластеры цветом фона.

Вы можете использовать следующие этапы:

Преобразование изображения в оттенки серого, применение порога и инвертирование полярности.
Удалить все кластеры, имеющие более 100 пикселей (предположим, что буквы меньше).
Расширять thresh для объединения текстовых областей в единые "блоки".
Поиск контуров на расширенном thresh изображении.
Найдите ограничивающие прямоугольники и примените OCR к прямоугольнику.

Вот полный пример кода:

import numpy as np
import cv2
import pytesseract

pytesseract.pytesseract.tesseract_cmd = r'C:\Program Files\Tesseract-OCR\tesseract.exe'  # I am using Windows

img = cv2.imread('img.png')  # Read input image

gray = cv2.cvtColor(img, cv2.COLOR_BGR2GRAY)  # Convert to Grayscale.

ret, thresh = cv2.threshold(gray, 0, 255, cv2.THRESH_BINARY_INV + cv2.THRESH_OTSU)  # Convert to binary and invert polarity

nlabel,labels,stats,centroids = cv2.connectedComponentsWithStats(thresh, connectivity=8)

thresh_size = 100

# Delete all lines by filling large clusters with zeros.
for i in range(1, nlabel):
    if stats[i, cv2.CC_STAT_AREA] > thresh_size:
        thresh[labels == i] = 0

# Dilate thresh for uniting text areas to single blocks.
dilated_thresh = cv2.dilate(thresh, np.ones((5,5)))

# Find contours on dilated thresh
contours, hierarchy = cv2.findContours(dilated_thresh, cv2.RETR_EXTERNAL, cv2.CHAIN_APPROX_NONE)

# Iterate contours, find bounding rectangles
for c in contours:
    # Get bounding rectangle
    x, y, w, h = cv2.boundingRect(c)

    # Draw green rectangle for testing
    cv2.rectangle(img, (x, y), (x+w, y+h), (0, 255, 0), thickness = 1)

    # Get the slice with the text (slice with margins).
    afterd = thresh[y-3:y+h+3, x-3:x+w+3]

    # Show afterd as image for testing
    # cv2.imshow('afterd', afterd)
    # cv2.waitKey(100)

    # The OCR works only when image is enlarged and black text?
    resized_afterd = cv2.resize(afterd, (afterd.shape[1]*5, afterd.shape[0]*5), interpolation=cv2.INTER_LANCZOS4)

    print(pytesseract.image_to_string(255 - resized_afterd, lang='eng', config='--psm 3'))


cv2.imshow('thresh', thresh)
cv2.imshow('img', img)
cv2.waitKey(0)
cv2.destroyAllWindows()

Строки результата после OCR:

DF6DF645
RFFTW
2345
2277
AABBA
DF1267
ABCET5456

Введите изображение с зелеными прямоугольниками вокруг текста:

Обновление:

Группировка контуров:

Для контуров вы можете использовать hierarchy результат cv2.findContours с cv2.RETR_TREE.
См. Иерархия контуров документация.

Вы можете использовать отношения родитель-ребенок для группировки контуров.

Вот неполный пример кода для использования иерархии:

img = cv2.imread('img.png')  # Read input image

gray = cv2.cvtColor(img, cv2.COLOR_BGR2GRAY)  # Convert to Grayscale.

ret, thresh = cv2.threshold(gray, 0, 255, cv2.THRESH_BINARY_INV + cv2.THRESH_OTSU)  # Convert to binary and invert polarity

nlabel,labels,stats,centroids = cv2.connectedComponentsWithStats(thresh, connectivity=8)

thresh_boxes = np.zeros_like(thresh)

thresh_size = 100

# Delete all lines by filling large clusters with zeros.
# Make new image that contains only boxes - without text
for i in range(1, nlabel):
    if stats[i, cv2.CC_STAT_AREA] > thresh_size:
        thresh[labels == i] = 0
        thresh_boxes[labels == i] = 255


# Find contours on thresh_boxes, use cv2.RETR_TREE to build tree with hierarchy
contours, hierarchy = cv2.findContours(thresh_boxes, cv2.RETR_TREE, cv2.CHAIN_APPROX_NONE)
# Iterate contours, and hierarchy
for c, i in zip(contours, range(len(contours))):
    h = hierarchy[0, i, :]
    h_child = h[2]
    # if contours has no child (last level)
    if h_child == -1:
        h_parent = h[3]
        x, y, w, h = cv2.boundingRect(c)
        cv2.putText(img, str(h_parent), (x+w//2-4, y+h//2+8), fontFace=cv2.FONT_HERSHEY_SIMPLEX, fontScale=1, color=(0, 0, 255), thickness=2)

cv2.imshow('thresh', thresh)
cv2.imshow('img', img)
cv2.waitKey(0)
cv2.destroyAllWindows()

Результат:

opencv, python, как читать сгруппированный текст в полях

Пожалуйста, войдите или зарегистрируйтесь чтобы ответить на этот вопрос.

1 Ответ

Обновление:

Пожалуйста, войдите или зарегистрируйтесь что бы добавить комментарий.

opencv, python, как читать сгруппированный текст в полях

Пожалуйста, войдите или зарегистрируйтесь чтобы ответить на этот вопрос.

1 Ответ

Обновление:

Пожалуйста, войдите или зарегистрируйтесь что бы добавить комментарий.

Нет похожих вопросов