Позвольте мне сначала сказать, что я не уверен, правильно ли я использую эту библиотеку.
Метод # 1
Я ухожу с этой страницы (это Github ).Я использую этот код:
from ABBYY import CloudOCR
ocr = CloudOCR(application_id='ApplicationID', password='SuperSecretPasswordFromAbbyy')
pdf = open('blah.pdf', 'rb')
file = {pdf.name: pdf}
result = ocr.process_and_download(
file,
exportFormat='xml,pdfTextAndImages',
language='English'
)
print(result)
Вот ошибка, которую я получаю:
requests.exceptions.HTTPError: 403 Client Error: Forbidden for url: http://cloud.ocrsdk.com/processImage?exportFormat=xml%2CpdfTextAndImages&language=English
Если я перехожу по ссылке внутри трассировки ошибок, я вижу следующий текст:
404 HTTP method GET not supported for /processImage, only method POST supported
Метод # 2
Я пытаюсь отправить локальный PDF на платформу Cloud OCR.Я добился успеха, используя найденный пакет здесь примерно так:
$ export ABBYY_APPID='ApplicationID'
$ export ABBYY_PWD='SuperSecretPasswordFromAbbyy'
...
$ python process.py -pdf blah.pdf result.txt
Я хочу реализовать систему, используя метод # 1.Мне просто интересно, что нужно сделать по-другому, чтобы это произошло.Тот факт, что метод № 2 работает, показывает, что аутентификация не является проблемой.