Я пытаюсь построить классификатор Tra sh, но проблема метода в том, что объекты почти одинаковы. Нет никакого способа различить человеческим глазом. Итак, я нашел что-то под названием Object Extraction
или Watershed
al go. Я думаю об использовании метода в preprocessing_method
из ImageDataGenerator
.
Я нашел учебник, из которого я мог бы сделать функцию. Есть 2 проблемы с функцией
- . Она обрабатывает только массив изображений, который открывается
cv2.imread()
, но не простой массив изображений 3-D numpy. - На конец этого, это дает баун dry. Как извлечь из него объект только с прозрачным фоном.
Вот метод
def extract_obj(img):
# img = cv2.resize(img,(W,H))
#r,g,b = cv2.split(img)
#rgb_img = cv2.merge([r,g,b])
gray = cv2.cvtColor(img,cv2.COLOR_BGR2GRAY)
ret, thresh = cv2.threshold(gray,0,255,cv2.THRESH_BINARY_INV+cv2.THRESH_OTSU)
# noise removal
kernel = np.ones((2,2),np.uint8)
# opening = cv2.morphologyEx(thresh,cv2.MORPH_OPEN,kernel, iterations = 2)
closing = cv2.morphologyEx(thresh,cv2.MORPH_CLOSE,kernel, iterations = 2)
sure_bg = cv2.dilate(closing,kernel,iterations=3)
# Finding sure foreground area
dist_transform = cv2.distanceTransform(sure_bg,cv2.DIST_L2,3)
# Threshold
ret, sure_fg = cv2.threshold(dist_transform,0.1*dist_transform.max(),255,0)
# Finding unknown region
sure_fg = np.uint8(sure_fg)
unknown = cv2.subtract(sure_bg,sure_fg)
# Marker labelling
ret, markers = cv2.connectedComponents(sure_fg)
# Add one to all labels so that sure background is not 0, but 1
markers = markers+1
# Now, mark the region of unknown with zero
markers[unknown==255] = 0
markers = cv2.watershed(img,markers)
img[markers == -1] = [255,0,0]
return img