Question

Я пытаюсь разобрать текст в изображении ресторанного счета. Я смог настроить ruby AWS SDK, в котором клиент Rekognition использует в этом примере . Более того, локально я смог позвонить в Rekognition, передав изображение локально.

Когда я выполняю вызов с помощью #detect_text ( документы ), я получаю ответ, и ответ имеет TextDetections, которые представляют собой строки или слова на изображении. Однако я хотел бы, чтобы ответ содержал только TextDetections типа LINE. Вот мои вопросы:

Возможно ли получить ответ, который содержит только TextDetections типа LINE?
Можно ли увеличить предел обнаруженных слов в образе? Очевидно, согласно документам :

DetectText может обнаружить до 50 слов в изображении, которое звучит как жесткий предел для меня.

Можно ли обойти ограничение в 50 слов на изображении? Возможно, я могу сделать несколько вызовов для одного и того же изображения, где Rekognition может анализировать одно и то же изображение несколько раз, пока в нем не появятся все слова?

Vamsi Vutukuru · Answer 1 · 01 апреля 2020

Да. Вы не можете обнаружить более 50 слов на изображении. Обходной путь - обрезать изображение на несколько изображений и запускать DetectText для каждого обрезанного изображения.

AWS Rekognition - Как разобрать весь текст в изображении?

Пожалуйста, войдите или зарегистрируйтесь чтобы ответить на этот вопрос.

1 Ответ

Пожалуйста, войдите или зарегистрируйтесь что бы добавить комментарий.

AWS Rekognition - Как разобрать весь текст в изображении?

Пожалуйста, войдите или зарегистрируйтесь чтобы ответить на этот вопрос.

1 Ответ

Пожалуйста, войдите или зарегистрируйтесь что бы добавить комментарий.

Похожие темы