Могу ли я извлечь буквы из изображений и сохранить их как файлы изображений .png с помощью Pytesseract? Если нет, что я могу использовать для этого? Я хочу найти отдельные буквы на изображении, связать их и сохранить их как отдельные изображения. В настоящее время я использую этот код, чтобы попробовать это, но он продолжает давать мне нечетные результаты . Мол, линии и очень маленькие пиксельные изображения. Изображения, из которых я извлекаю буквы, имеют размер 400 x 400 пикселей.
for i in range(IMAGES):
imagePath = user + "/" + str(i+1) + ".png"
image = cv2.imread(imagePath)
im_bw = cv2.cvtColor(image, cv2.COLOR_RGB2GRAY)
ret,thresh1 = cv2.threshold(im_bw,127,255,cv2.THRESH_BINARY)
contours, hierarchy = cv2.findContours(im_bw, cv2.RETR_TREE, cv2.CHAIN_APPROX_SIMPLE)
for cnt in contours:
x,y,w,h = cv2.boundingRect(cnt)
cv2.rectangle(image,(x,y),(x+w,y+h),(0,255,0),3)
i=0
for cnt in contours:
x,y,w,h = cv2.boundingRect(cnt)
letterImage = cv2.imwrite(user+"/letter"+str(i)+".png",thresh1[y:y+h,x:x+w])
letterImage = cv2.resize(letterImage, (28, 28))
i += 1