AWS Rekognition - Как разобрать весь текст в изображении? - PullRequest
0 голосов
/ 22 марта 2020

Я пытаюсь разобрать текст в изображении ресторанного счета. Я смог настроить ruby AWS SDK, в котором клиент Rekognition использует в этом примере . Более того, локально я смог позвонить в Rekognition, передав изображение локально.

Когда я выполняю вызов с помощью #detect_text ( документы ), я получаю ответ, и ответ имеет TextDetections, которые представляют собой строки или слова на изображении. Однако я хотел бы, чтобы ответ содержал только TextDetections типа LINE. Вот мои вопросы:

  1. Возможно ли получить ответ, который содержит только TextDetections типа LINE?
  2. Можно ли увеличить предел обнаруженных слов в образе? Очевидно, согласно документам :

DetectText может обнаружить до 50 слов в изображении, которое звучит как жесткий предел для меня.

Можно ли обойти ограничение в 50 слов на изображении? Возможно, я могу сделать несколько вызовов для одного и того же изображения, где Rekognition может анализировать одно и то же изображение несколько раз, пока в нем не появятся все слова?

1 Ответ

1 голос
/ 01 апреля 2020

Да. Вы не можете обнаружить более 50 слов на изображении. Обходной путь - обрезать изображение на несколько изображений и запускать DetectText для каждого обрезанного изображения.

...