Amazon Textract против Amazon Rekognition DetectText - PullRequest
2 голосов
/ 06 мая 2019

Как мне решить, когда использовать Amazon Textract против TextDetect метода Amazon Rekognition?

Мой пример использования - это щелкнуть картинку с мобильного телефона, преобразовать данные изображения в текст и сохранить в AWS RDS.

Ответы [ 2 ]

5 голосов
/ 06 мая 2019

Что касается сквозного решения проблем, Textract будет работать лучше, потому что он более полнофункциональный для OCR.

Textract - это более новый сервис AWS, созданный как специально разработанное решение проблемы оптического распознавания символов в изображениях (и PDF-файлах). В то время как Rekognition является более универсальной службой компьютерного зрения, Textract имеет гораздо больше параметров настройки, ориентированных на оптическое распознавание символов, для оптимизации процесса точного и эффективного извлечения текста.

Из коробки, если все, что вы пытаетесь сделать, это обнаружить текст и соответствующие метаданные (координаты, угол, значение достоверности), метод Rekognition DetectText, скорее всего, будет работать аналогично методу analyze_document, эквивалентному в Textract. Однако Textract предлагает дополнительную настройку, которая помогает с обработкой / форматированием текста, абстрагируясь от других форм постобработки, которые разработчик традиционно должен был бы написать сам.

Примечание. На сегодняшний день (6/6/19) Textract в настоящее время все еще находится в режиме ограниченного предварительного просмотра, поэтому в зависимости от того, насколько быстро вам нужно построить решение, это еще один вопрос, который следует учитывать.

1 голос
/ 07 мая 2019

Если на картинке просто случайный текст, используйте Amazon Rekognition . Он найдет текст в любом месте.

Amazon Textract предназначен для преобразования бумажных документов в организованные данные . Вероятно, он не будет хорошо работать со случайной картинкой (хотя я не пробовал, поэтому я не уверен!).

Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...