Как найти края документа на разноцветных фонах, используя opencv python? [Сканирование документов в различных фонах] - PullRequest
3 голосов
/ 04 апреля 2019

В настоящее время у меня есть документ, который необходимо отсканировать с умом.

Для этого мне нужно найти правильные контуры документа на любом фоне, чтобы я мог выполнять искаженную перспективную проекцию и обнаружение с этимобраз.

Основная проблема, с которой столкнулся при этом, заключается в том, что край документа обнаруживает любой фон.

Я попытался использовать функцию HoughLineP и попытался найти контуры на размытом изображении в градациях серого, пропущенном черезОбнаружение канни-края до сих пор.


            MORPH = 9
            CANNY = 84
            HOUGH = 25

            IM_HEIGHT, IM_WIDTH, _ = rescaled_image.shape

            # convert the image to grayscale and blur it slightly
            gray = cv2.cvtColor(rescaled_image, cv2.COLOR_BGR2GRAY)
            gray = cv2.GaussianBlur(gray, (7,7), 0)

            #dilate helps to remove potential holes between edge segments
            kernel = cv2.getStructuringElement(cv2.MORPH_RECT,(MORPH,MORPH))
            dilated = cv2.dilate(gray, kernel)

            # find edges and mark them in the output map using the Canny algorithm
            edged = cv2.Canny(dilated, 0, CANNY)
            test_corners = self.get_corners(edged)

            approx_contours = []

    (_, cnts, hierarchy) = cv2.findContours(edged.copy(), cv2.RETR_LIST, cv2.CHAIN_APPROX_SIMPLE)
            cnts = sorted(cnts, key=cv2.contourArea, reverse=True)[:5]

            # loop over the contours
            for c in cnts:
                # approximate the contour
                approx = cv2.approxPolyDP(c, 80, True)
                if self.is_valid_contour(approx, IM_WIDTH, IM_HEIGHT):
                    approx_contours.append(approx)
                    break

Sample Image of Document Как найти правильную ограничивающую рамку вокруг документа с помощью кода OpenCV.Любая помощь будет высоко ценится.(Документ взят с камеры под любым углом и на любом цветном фоне.)

Ответы [ 2 ]

1 голос
/ 04 апреля 2019

Следующий код может помочь вам обнаружить / сегментировать страницу в изображении ...

import cv2
import matplotlib.pyplot as plt
import numpy as np
image = cv2.imread('test_p.jpg')
image = cv2.imread('test_p.jpg')
print(image.shape)
ori = image.copy()
image = cv2.resize(image, (image.shape[1]//10,image.shape[0]//10))

Изменить размер изображения, чтобы ускорить выполнение операций, чтобы мы могли работать в режиме реального времени ..

gray = cv2.cvtColor(image, cv2.COLOR_BGR2GRAY)
gray = cv2.GaussianBlur(gray, (11,11), 0)
edged = cv2.Canny(gray, 75, 200)
print("STEP 1: Edge Detection")
plt.imshow(edged)
plt.show()
cnts = cv2.findContours(edged.copy(), cv2.RETR_LIST, cv2.CHAIN_APPROX_SIMPLE)
cnts = sorted(cnts[1], key = cv2.contourArea, reverse = True)[:5]

Здесь мы рассмотрим только первые 5 контуров из отсортированного списка на основе области. Здесь размер размытия по Гауссу является бит-чувствительным, поэтому выбирайте его соответствующим образом в зависимости от размера изображения.После описанных выше операций изображение может выглядеть следующим образом: *

Image with Edges

for c in cnts:
    ### Approximating the contour
    #Calculates a contour perimeter or a curve length
    peri = cv2.arcLength(c, True)
    approx = cv2.approxPolyDP(c, 0.01 * peri, True)
    # if our approximated contour has four points, then we
    # can assume that we have found our screen
    screenCnt = approx
    if len(approx) == 4:
        screenCnt = approx
        break
    # show the contour (outline) 
    print("STEP 2: Finding Boundary")
cv2.drawContours(image, [screenCnt], -1, (0, 255, 0), 2)
image_e = cv2.resize(image,(image.shape[1],image.shape[0]))
cv2.imwrite('image_edge.jpg',image_e)
plt.imshow(image_e)
plt.show()

Окончательное изображение может выглядеть следующим образом ...

Остальная частьвсе может быть обработано после получения окончательного изображения ...

Код ссылки: - Git Repository

Полагаю, этот ответ будет полезен ...

1 голос
/ 04 апреля 2019

Существует аналогичная проблема, которая называется ортографическая проекция.

Орфографические подходы

Вместо того, чтобы делать, размытие по Гауссу + морфологическая операция для получения края документапопробуйте сначала выполнить ортогональную проекцию, а затем найти контуры с помощью вашего метода.

Для определения правильного ограничивающего прямоугольника попробуйте некоторые предустановленные значения или контрольную букву, после которой ортографическая проекция позволит вам вычислить высоту и, следовательно,размеры ограничительной рамки.

...