Можем ли мы сделать внутренний вызов Google API?Устанавливать все предварительные требования локально для OCR? - PullRequest
3 голосов
/ 15 апреля 2019

Пытается внедрить OCR в банковской среде, но проблема в том, что у нас нет доступа к интернет-соединению по соображениям безопасности.

"Рукописный и отсканированный документ для оцифровки"

с открытым исходным кодомКак и Tesseract OCR хороши для нормального английского, но большинство наших документов написаны от руки на арабском языке.Я попробовал Google OCR API здесь , в котором AI & ML работает лучше с арабской рукописью и большей точностью.Я создал облако Google, создал хранилище и загрузил рукописное арабское изображение в корзину, а затем выполнил внутреннюю команду в облачном терминале, которая дает правильный результат.

Внешний вызов API:



curl -X POST \
     -H "Authorization: Bearer "$(gcloud auth application-default print-access-token) \
     -H "Content-Type: application/json; charset=utf-8" \
     --data "{
      'requests': [
        {
          'image': {
            'source': {
              'imageUri': 'gs://vision-api-handwriting-ocr-bucket/handwriting_image.png'
            }
          },
          'features': [
            {
              'type': 'DOCUMENT_TEXT_DETECTION'
            }
          ]
        }
      ]
    }" "https://vision.googleapis.com/v1/images:annotate"

Внутренний GoogleCloud cmd:

gcloud ml vision detect-document "gs://vision-api-handwriting-ocr-bucket/handwriting_image.png"

Приведенный выше внутренний код Google Cloud cmd отлично работает в моем случае.То же самое мне нужно реализовать в локальной системе. Есть ли возможность установить ту же облачную среду Google и их механизм OCR на локальном компьютере?Если его цена также не проблема, готовы платить и покупать. Ресурс, как серверы с высокой конфигурацией, объединяет в сеть все, что уже доступно в нашем банке.

1 Ответ

1 голос
/ 15 апреля 2019

OCR Google только онлайн.=> Офлайн Арабский OCR Альтернативы:

  • Abbyy SDK

  • Поддержка OCR.space Арабский OCR и имеет Offline OCR версия .(Онлайн версия бесплатная , но оффлайн версия коммерческая).

  • Другой вариант - использовать Tesseract (бесплатный и с открытым исходным кодом!), Но качество распознавания его не так хорошо.

...