Точность данных извлечения текста API Google Vision (DOCUMENT_TEXT_DETECTION) - PullRequest
0 голосов
/ 17 сентября 2018

Использование JAVA SDK для GCP Vision API для распознавания текста (извлечение текста). Перешли к функции TEXT_DETECTION до DOCUMENT_TEXT_DETECTION . Изображение, которое я протестировал, называется «Мохан Д».

  • TEXT_DETECTION : я получаю правильный текст, но не получаю другой символ
  • Если я использую DOCUMENT_TEXT_DETECTION , получая имя как «MOHAND (пробел не идет)

Подскажите, пожалуйста, нужно ли мне использовать какую-то конкретную опцию для получения большей точности данных

1 Ответ

0 голосов
/ 17 сентября 2018

Модели, используемые сервисом Cloud Vision API , постоянно совершенствуются, чтобы обеспечить лучшую точность распознавания;однако иногда они неправильно понимают символы или даже не распознают сами символы.Имейте в виду, что эти сервисы проходят ежедневную подготовку, что означает, что качество распознавания будет соответственно повышаться.

Исходя из этого, я думаю, что доступный обходной путь должен следовать формату / размеру файлов и language рекомендации, а также реализовать свойство LanguageHints, которое обычно используется, когда службе трудно определить язык, включенный в изображение, и это может помочь вам повысить точность результатов распознавания.

Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...