Пытается внедрить OCR в банковской среде, но проблема в том, что у нас нет доступа к интернет-соединению по соображениям безопасности.
"Рукописный и отсканированный документ для оцифровки"
с открытым исходным кодомКак и Tesseract OCR хороши для нормального английского, но большинство наших документов написаны от руки на арабском языке.Я попробовал Google OCR API здесь , в котором AI & ML работает лучше с арабской рукописью и большей точностью.Я создал облако Google, создал хранилище и загрузил рукописное арабское изображение в корзину, а затем выполнил внутреннюю команду в облачном терминале, которая дает правильный результат.
Внешний вызов API:
curl -X POST \
-H "Authorization: Bearer "$(gcloud auth application-default print-access-token) \
-H "Content-Type: application/json; charset=utf-8" \
--data "{
'requests': [
{
'image': {
'source': {
'imageUri': 'gs://vision-api-handwriting-ocr-bucket/handwriting_image.png'
}
},
'features': [
{
'type': 'DOCUMENT_TEXT_DETECTION'
}
]
}
]
}" "https://vision.googleapis.com/v1/images:annotate"
Внутренний GoogleCloud cmd:
gcloud ml vision detect-document "gs://vision-api-handwriting-ocr-bucket/handwriting_image.png"
Приведенный выше внутренний код Google Cloud cmd отлично работает в моем случае.То же самое мне нужно реализовать в локальной системе. Есть ли возможность установить ту же облачную среду Google и их механизм OCR на локальном компьютере?Если его цена также не проблема, готовы платить и покупать. Ресурс, как серверы с высокой конфигурацией, объединяет в сеть все, что уже доступно в нашем банке.