Распознавание прямоугольников в шаблонных изображениях - PullRequest
0 голосов
/ 07 января 2019

Итак, я пытаюсь распознать регион, который уже был определен ограничительной рамкой. Пример: Bowser

Некоторые области внутри этих прямоугольников на этих изображениях белые, а некоторые черные, и большинство из них имеют совершенно разные размеры. Единственная общая характеристика между этими изображениями - красный прямоугольник: enter image description here

По сути, я пытаюсь создать случайно сгенерированного мем-бота, который помещает случайное исходное изображение в область, определенную этими прямоугольниками. У меня есть тонны этих изображений уже с предопределенными областями с этими красными прямоугольниками для использования. Я хочу как-то автоматизировать процесс, в настоящее время для каждого шаблона должны быть определены каждая форма и смещение изменения размера. Поэтому мне нужно распознать область внутри прямоугольника и вернуть ей определенную форму изменения размера и смещение, необходимые для размещения исходного изображения.

Как мне поступить об этом? Должен ли я использовать что-то в OpenCV или мне придется тренировать CNN? Просто действительно ищу толчок в правильном направлении, потому что я довольно растерян в отношении лучшего подхода к этой проблеме.

1 Ответ

0 голосов
/ 07 января 2019

Я думаю, что OpenCV может сделать это. Ниже приведен краткий пример того, что вам нужно. Прочитайте комментарии в коде для более подробной информации.

import cv2
import numpy as np

img = cv2.imread("1.jpg")

#STEP1: get only red color (or the bounding box color) in the image
hsv = cv2.cvtColor(img, cv2.COLOR_BGR2HSV)
# define range of red color in HSV
lower_red = np.array([0,50,50])
upper_red = np.array([0,255,255])
# Threshold the HSV image to get only blue colors
mask = cv2.inRange(hsv, lower_red, upper_red)
red_only = cv2.bitwise_and(img,img, mask= mask)

#STEP2: find contour
gray_img = cv2.cvtColor(red_only,cv2.COLOR_BGR2GRAY)
_,thresh = cv2.threshold(gray_img,1,255,cv2.THRESH_BINARY)

_,contours,_ = cv2.findContours(thresh, cv2.RETR_TREE, cv2.CHAIN_APPROX_SIMPLE)

#max contour in the image is the box you want
areas = [cv2.contourArea(c) for c in contours]
sorted_areas = np.sort(areas)
cnt=contours[areas.index(sorted_areas[-1])]
r = cv2.boundingRect(cnt)
cv2.rectangle(img,(r[0],r[1]),(r[0]+r[2],r[1]+r[3]),(0,255,0),3)

cv2.imshow("img",img)
cv2.imshow("red_only",red_only)
cv2.imshow("thresh",thresh)

cv2.waitKey()
cv2.destroyAllWindows()

enter image description here

enter image description here

enter image description here

...