Тессеракт не установлен или не находится на вашем пути на AWS Lambda - PullRequest
0 голосов
/ 25 марта 2020

Я установил pytesseract на Lambda Layer, а затем активировал слой в нужной функции.

Когда я выполняю простой пример, используя это:

def ocr(img_path, config="--oem 1 -l fra --psm 3"):
    """ This function is called by get_text_OCR_Parallel
        we can modify the tesseract config here
    """
    raw_text = pytesseract.image_to_string(img_path, config=config)

    return raw_text

Я получаю, что tesseract не установлен или отсутствует в вашем пути. Исполняемый файл находится внутри .zip, который я использовал для создания слоя. Это полный путь: /bin/tesseract

В pytessaract.py в Lambda у меня есть:

# CHANGE THIS IF TESSERACT IS NOT IN YOUR PATH, OR IS NAMED DIFFERENTLY
tesseract_cmd = 'tesseract'
RGB_MODE = 'RGB' 
OSD_KEYS = {
    'Page number': ('page_num', int),
    'Orientation in degrees': ('orientation', int),
    'Rotate': ('rotate', int),
    'Orientation confidence': ('orientation_conf', float),
    'Script': ('script', str),
    'Script confidence': ('script_conf', float)
}

Я изменяю на tesseract_cmd = '/bin/tesseract', но это не сработало.

Любые предложения, пожалуйста.?

Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...