Настройка области обнаружения изображений в Google Cloud Vision API OCR - PullRequest
0 голосов
/ 04 октября 2018

Я использовал Google Cloud Vision API для обнаружения текста документа, но я не мог понять, позволяет ли он определить конкретную область изображения, из которой можно извлечь текст.Например, если мое изображение содержит 3 столбца текста, и я хочу указать координаты верхнего левого угла, ширину и высоту определенного столбца, для которого я хочу выполнить OCR.Является ли это возможным?Также есть ли другой способ, чтобы не перепутать текст, когда у нас есть 3 столбца текста в изображении?

Ответы [ 2 ]

0 голосов
/ 07 февраля 2019

Вы можете создать свой собственный класс-оболочку вокруг класса Detector.Затем заново создайте растровое изображение в объекте frame, который передается в метод обнаружения.

0 голосов
/ 04 октября 2018

В настоящее время невозможно определить конкретную область изображения для извлечения текста.Для этого нет доступных параметров в контексте изображения ни в API REST , ни в gRPC .Возможный обходной путь - обрезать изображение и отправить только текст, который вы хотите расшифровать.Если вы хотите попытаться автоматизировать этот процесс, возможно, будут полезны функции локализация объекта или подсказки обрезки .

Что касается перемешанного текста, вы можетебыть в состоянии найти каждый блок или абзац в ответе Json .

...