Как улучшить код обнаружения формы Python - PullRequest
0 голосов
/ 20 июня 2019

Я работаю над кодом, который должен делать скриншот из нашего программного обеспечения для полетов роботов, подсчитывать количество фигур на экране и отображать числа.В настоящее время я могу идентифицировать и считать фигуры, когда в коде передается идеальное изображение фигуры.Когда мы пытаемся идентифицировать фигуры с помощью робота, фигуры искажаются, меняют темноту или меняют размер.Мы должны иметь возможность идентифицировать формы независимо от этих недостатков.

Идеальное изображение, которое отлично работает: Изображение

Пример изображения от робота, который не может быть идентифицирован: Image

Мы пытались добавить больше маскировки и слоя, но это не внесло никаких изменений.


import numpy as np
import pyautogui
import cv2
import tkinter as tk
from PIL import Image, ImageDraw, ImageFont

######################################################################
pyautogui.screenshot('image.jpg')

font = cv2.FONT_HERSHEY_COMPLEX

tri = 0
rect = 0
line = 0
circ = 0

img = cv2.imread("image.jpg", cv2.IMREAD_GRAYSCALE)

#img = img[700:1800, 1000:3300]

_, threshold = cv2.threshold(img, 240, 255, cv2.THRESH_BINARY)
contours, hierarchy = cv2.findContours(threshold, cv2.RETR_TREE, cv2.CHAIN_APPROX_SIMPLE)

for cnt in contours:
    approx = cv2.approxPolyDP(cnt, 0.01*cv2.arcLength(cnt, True), True)
    cv2.drawContours(img, [approx], 0, (0))
    x = approx.ravel()[0]
    y = approx.ravel()[1]
    area = cv2.contourArea(cnt)
    if len(approx) == 3:
        if(50000 > area > 5000):
            cv2.putText(img, str(area), (x, y), font, 1, (0))
            tri += 1
    elif len(approx) == 4:
        if (50000 > area > 5000):
            cv2.putText(img, str(area), (x, y), font, 1, (0))
            rect += 1
    elif len(approx) == 5:
        if (50000 > area > 5000):
            cv2.putText(img, str(area), (x, y), font, 1, (0))
            tri += 1
    elif 6 < len(approx) < 15:
        if (50000 > area > 5000):
            cv2.putText(img, str(area), (x, y), font, 1, (0))
            circ += 1
    else:
        if (4000 > area > 1300):
            cv2.putText(img, str(area), (x, y), font, 1, (0))
            line += 1

cv2.imshow("shapes", img)
##cv2.imshow("Threshold", threshold)

im = Image.new("RGB", (512,512), (255,255,255))
fnt = ImageFont.truetype('arial.ttf', 40)
d = ImageDraw.Draw(im)

d.polygon((60,10,10,110,110,110),(255,0,0))
d.rectangle((10,120,110,220),(255,0,0))
d.line((60,230,60,330),(255,0,0),20)
d.ellipse((10,340,110,440),(255,0,0))
shapes = [tri, rect, line, circ]
i=0
while i<4:
    d.text((200,i*110+50), str(shapes[i]) , font=fnt, fill=(255,0,0))
    i+=1

im.show()

cv2.waitKey(0)
cv2.destroyAllWindows()

Нам нужно усовершенствование, которое может сделать код более надежным и способнымобнаруживать формы независимо от этих недостатков.

Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...