Google cloud vision OCR читает одно и то же письмо более одного раза - PullRequest
1 голос
/ 29 мая 2019

Я использую оптическое распознавание текста в облаке Google для извлечения текста из изображений чеков и наткнулся на эту странную проблему, когда оптическое распознавание текста читает одно и то же письмо дважды, но с разными координатами.Чтобы визуализировать проблему, я рисую прямоугольники вокруг каждой буквы, используя координаты, возвращаемые API: это часть изображения с проблемой:

example

Как вы можете видеть,Есть перекрывающиеся прямоугольники на «М» и «а».В результате получается что-то вроде этого: '' 'MMaay 10, 2019' ''

Почему это происходит?Есть ли способ это исправить?

Я пытался изменить формат изображения с bmp на png.Единственное отличие состоит в том, что перекрывающийся прямоугольник перемещается от «а» к «у».

...