Контурирование и ограничение отдельных букв на изображении и сохранение каждой буквы как отдельного изображения - PullRequest
0 голосов
/ 07 мая 2019

Могу ли я извлечь буквы из изображений и сохранить их как файлы изображений .png с помощью Pytesseract? Если нет, что я могу использовать для этого? Я хочу найти отдельные буквы на изображении, связать их и сохранить их как отдельные изображения. В настоящее время я использую этот код, чтобы попробовать это, но он продолжает давать мне нечетные результаты . Мол, линии и очень маленькие пиксельные изображения. Изображения, из которых я извлекаю буквы, имеют размер 400 x 400 пикселей.

    for i in range(IMAGES):
            imagePath = user + "/" + str(i+1) + ".png"

            image = cv2.imread(imagePath)
            im_bw = cv2.cvtColor(image, cv2.COLOR_RGB2GRAY)
            ret,thresh1 = cv2.threshold(im_bw,127,255,cv2.THRESH_BINARY)
            contours, hierarchy = cv2.findContours(im_bw, cv2.RETR_TREE, cv2.CHAIN_APPROX_SIMPLE)
            for cnt in contours:
                    x,y,w,h = cv2.boundingRect(cnt)
                    cv2.rectangle(image,(x,y),(x+w,y+h),(0,255,0),3)

            i=0
            for cnt in contours:
                    x,y,w,h = cv2.boundingRect(cnt)
                    letterImage = cv2.imwrite(user+"/letter"+str(i)+".png",thresh1[y:y+h,x:x+w])
                    letterImage = cv2.resize(letterImage, (28, 28))
                    i += 1
...