Почему API Google PDF DOCUMENT_TEXT_DETECTION намного медленнее, чем Google JPG DOCUMENT_TEXT_DETECTION API - PullRequest
1 голос
/ 20 мая 2019

Я заметил, что Google Vision PDF OCR DOCUMENT_TEXT_DETECTION занимает около 15 секунд, чтобы обнаружить одну страницу PDF https://cloud.google.com/vision/docs/pdf.Но если я отправляю ту же страницу PDF, что и JPG, для обнаружения текстов требуется менее 3 секунд https://cloud.google.com/vision/docs/detecting-fulltext

Я использовал приведенный здесь код (C #) https://cloud.google.com/vision/docs/pdf#vision-pdf-detection-gcs-csharp

Я заметилдля следующей строки кода требуется около 15 секунд, чтобы сказать, что весь текст в PDF обнаружен и сохранен в gsBucket operation.PollUntilCompleted();

  • Мой GsBucket - это «Multi-Regional Storage» US
  • Я также загружаю из США

Мне было интересно, что еще я могу сделать, чтобы ускорить процесс, или это ожидается?

...