Обнаружение текста документа PDF / TIFF - PullRequest
0 голосов
/ 11 сентября 2018

В настоящее время я пытаюсь использовать API облачного видения Google для своего проекта. Проблема заключается в том, что API облачного видения Google для обнаружения текста документа принимает только URI облачных сервисов Google в качестве места назначения для ввода и вывода. Но у меня есть все мои проекты, данные на сервере Amazon S3, которые нельзя напрямую использовать с этим API.

Точки, которые следует отметить: -

  1. Все данные должны храниться только в S3 .
  2. Сейчас я не могу изменить свое облачное хранилище на GCS .
  3. Я не могу загрузить файлы из S3 и загрузить в GCS вручную. Номер файлов, поступающих в день, больше 1000 и меньше 100000.
  4. Даже если бы я мог автоматизировать загрузку и выгрузку PDF, это послужит узким местом для всего проекта, так как мне придется иметь дело с проблемами параллелизма и управления памятью.

Есть ли обходной путь, чтобы этот API работал с S3 URI? Мне нужна твоя помощь.

Спасибо

1 Ответ

0 голосов
/ 11 сентября 2018

В настоящее время Vision API не работает с URL-адресами, кроме URL-адресов Google Cloud Storage. Существует запрос функции для поиска изображений, связанный с использованием API с конкретными URL-адресами, где вы можете попросить рассмотреть эту функцию также для документов PDF / TIFF или поднять новый запрос функции для этого сценария.

...