Каковы идеальные размеры изображения для лучшего распознавания текста от Google Vision? - PullRequest
0 голосов
/ 02 ноября 2018

Я уже некоторое время пользуюсь оптическим распознаванием Google Vision. И я заметил, что результат распознавания зависит от размера изображения. Скажем, например, что изображение размером 720 x 1280 дает лучший результат, чем 360 x 720. И наоборот, иногда хуже.

Я испытал то же самое с OCR API от Microsoft.

Так есть ли идеальный размер изображения, который всегда дает хороший результат распознавания? Как размеры изображения влияют на результат распознавания?

Ответы [ 2 ]

0 голосов
/ 17 ноября 2018

На основе ссылки ниже, не только разрешение, соотношение сторон также является фактором https://www.mlreader.com/prepare-image-for-google-vision-api

0 голосов
/ 09 ноября 2018

Пожалуйста, обратитесь сюда для получения этой информации: Google Поддерживаемые изображения

FACE_DETECTION 1600 x 1200 Расстояние между глазами наиболее важно

LANDMARK_DETECTION 640 x 480

LOGO_DETECTION 640 x 480

LABEL_DETECTION 640 x 480

TEXT_DETECTION и DOCUMENT_TEXT_DETECTION 1024 x 768 Для распознавания текста требуется больше разрешение для обнаружения символов

SAFE_SEARCH_DETECTION 640 x 480

Google Поддерживаемые изображения

Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...