Документ Google Vision API Текст нескольких изображений в base64 String - PullRequest
0 голосов
/ 24 июня 2018

Я использую OCR API Google Vision (обнаружение текста документа), чтобы получить текст из отсканированного документа (строка base64).Работает идеально для одного изображения.Но как я могу отправить более одного изображения, например, на второй странице документа.

Я пытался объединить строки base64, но это не работает.

var base64ImagesArrayConcarved = base64ImagesArray.join('')

1 Ответ

0 голосов
/ 16 августа 2018

Cloud Vision API имеет метод files.asyncBatchAnnotate .что позволяет отправлять кучу файлов в одном запросе.Для добавления отдельных файлов используйте аннотацию асинхронного файла запросов.Пример включения двух изображений в пакетный запрос:

{
  "requests":[
    {
      "inputConfig": {
        "gcsSource": {
          "uri": "gs://<your bucket name>/image1.jpg"
        },
        "mimeType": "image/jpg"
      },
      "features": [
        {
          "type": "DOCUMENT_TEXT_DETECTION"
        }
      ],
      "outputConfig": {
        "gcsDestination": {
          "uri": "gs://<your bucket name>/output/"
        }
      }
    },
    {
      "inputConfig": {
        "gcsSource": {
          "uri": "gs://<your bucket name>/image2.jpg"
        },
        "mimeType": "image/jpg"
      },
      "features": [
        {
          "type": "DOCUMENT_TEXT_DETECTION"
        }
      ],
      "outputConfig": {
        "gcsDestination": {
          "uri": "gs://<your bucket name>/output/"
        }
      }
    }
  ]
}

Если вы специально работаете с PDF-файлами, я обнаружил это сообщение , в котором объясняется, как отправить запрос с помощьютакже asyncBatchAnnotate.

...