Распознавание букв с наложением - PullRequest
0 голосов
/ 27 февраля 2020

все. Я пишу код для распознавания букв, которые пересекаются друг с другом и окрашиваются в разные цвета (цвета могут повторяться для разных символов). Вопрос в том, как отделить символы друг от друга и затем поработать с ними по отдельности?

enter image description here

from PIL import Image
import pytesseract
import string

 pytesseract.pytesseract.tesseract_cmd = '...Tesseract-OCR/tesseract.exe'

image = '...\task_1_1.png'

 row_height = 86
 margin = 5
 img = Image.open(image)

 width, height = img.size
 lines = []

 for row in range(height // row_height):
  row_img = img.crop((0, row * row_height, width, (row + 1) * row_height))
  text = pytesseract.image_to_string(row_img, lang='eng')
 print (text)
...