Почему адаптивное пороговое изображение меньше исходного? - PullRequest
2 голосов
/ 11 февраля 2020

Я пытаюсь использовать adapativeThreshold в живом потоке, который в конечном итоге будет использоваться для определения формы. Обычный порог не показывает достаточно того, что я хочу видеть. Когда я использую приведенный ниже код, обычный порог получается таким, как и ожидалось, но адаптивные пороги по какой-то причине намного тоньше оригинала, и я ничего не вижу на виде. Похоже, что-то происходит, но я не могу сказать, что. Любые идеи о том, как я могу сделать адаптивный порог windows полный размер?

Это то, что я вижу, когда я запускаю программу в каждом окне: enter image description here

#import packages
from documentscanner.pyimagesearch.transform import four_point_transform
from pyimagesearch.shapedetector import ShapeDetector
from skimage.filters import threshold_local
import numpy as np
import cv2
import imutils


def draw_Contours(screen, points):
    cv2.drawContours(screen, [points], -1, (0, 255, 0), 2)
    cv2.imshow("Outline", screen)


def nothing(x):
    #any operation
    pass

#access video camera
cap = cv2.VideoCapture(0)

cv2.namedWindow('Trackbars')
cv2.createTrackbar('min_edge', 'Trackbars', 75, 100, nothing)
cv2.createTrackbar('max_edge', 'Trackbars', 110,300, nothing)

while True:
    _, frame = cap.read()       #read video camera data

    minedge = cv2.getTrackbarPos('min_edge', 'Trackbars')
    maxedge = cv2.getTrackbarPos('max_edge', 'Trackbars')

    #convert image to gray scale
    gray = cv2.cvtColor(frame, cv2.COLOR_BGR2GRAY)
    gray = cv2.GaussianBlur(gray, (5, 5), 0)
    #blur = cv2.GaussianBlur(frame, (5, 5), 0)
    #edged = cv2.Canny(gray, minedge, maxedge)

    #threshhold instead of edging
    thresh = cv2.threshold(gray, 60, 255, cv2.THRESH_BINARY)[1]
    thresh2 = cv2.adaptiveThreshold(gray, 255, cv2.ADAPTIVE_THRESH_GAUSSIAN_C,\
                                    cv2.THRESH_BINARY, 11, 2)[1]
    thresh3 = cv2.adaptiveThreshold(gray, 255, cv2.ADAPTIVE_THRESH_MEAN_C,\
                                    cv2.THRESH_BINARY, 11, 2)[1]

    #find contours in edges image, keeping the largest ones, and initialize the screen contour/shapedetect
    cnts = cv2.findContours(thresh.copy(), cv2.RETR_EXTERNAL, cv2.CHAIN_APPROX_SIMPLE)
    cnts = imutils.grab_contours(cnts)
    sd = ShapeDetector()
    cnts = sorted(cnts, key = cv2.contourArea, reverse = True)[:5]

    #loop over contours
    for c in cnts:
        #approximate the contour points
        peri = cv2.arcLength(c, True)
        approx = cv2.approxPolyDP(c, 0.02*peri, True)

        #check points in contour
        if len(approx) == 4:
            print("rectangle found: ")
            print(approx)
            draw_Contours(frame, approx)



        if len(approx) == 3:
            print("triangle found: ")
            print(approx)
            draw_Contours(frame, approx)

        if len(approx) == 2:
            print("line found: ")
            print(approx)
            draw_Contours(frame, approx)

        #show the countour(outline) of the shapes


    #show original frame and gray frame
    cv2.imshow('Frame', frame)
    #cv2.imshow('Copy', gray)
    #cv2.imshow('Edged', edged)
    cv2.imshow('Threshold', thresh)
    cv2.imshow('ThresholdGaussian', thresh2)
    cv2.imshow('ThresholdMean', thresh3)

    #detect key press and exit with escape key
    key = cv2.waitKey(1)
    if key == 27:
        break

#close the program
cap.release()
cv2.destroyAllWindows()

1 Ответ

2 голосов
/ 14 февраля 2020

Вместо использования

thresh2 = cv2.adaptiveThreshold(gray, 255, cv2.ADAPTIVE_THRESH_GAUSSIAN_C,\
                                cv2.THRESH_BINARY, 11, 2)[1]
thresh3 = cv2.adaptiveThreshold(gray, 255, cv2.ADAPTIVE_THRESH_MEAN_C,\
                                cv2.THRESH_BINARY, 11, 2)[1]

Используйте его без индексации numpy, и тогда эта ошибка не возникнет.

thresh2 = cv2.adaptiveThreshold(gray, 255, cv2.ADAPTIVE_THRESH_GAUSSIAN_C,\
                                cv2.THRESH_BINARY, 11, 2) # don't use [1] 
thresh3 = cv2.adaptiveThreshold(gray, 255, cv2.ADAPTIVE_THRESH_MEAN_C,\
                                cv2.THRESH_BINARY, 11, 2)

Это происходит потому, что обычное пороговое значение возвращает два значения, в то время как адаптивное порог возвращает только одно значение.

...