Я установил pytesseract на Lambda Layer, а затем активировал слой в нужной функции.
Когда я выполняю простой пример, используя это:
def ocr(img_path, config="--oem 1 -l fra --psm 3"):
""" This function is called by get_text_OCR_Parallel
we can modify the tesseract config here
"""
raw_text = pytesseract.image_to_string(img_path, config=config)
return raw_text
Я получаю, что tesseract не установлен или отсутствует в вашем пути. Исполняемый файл находится внутри .zip, который я использовал для создания слоя. Это полный путь: /bin/tesseract
В pytessaract.py
в Lambda у меня есть:
# CHANGE THIS IF TESSERACT IS NOT IN YOUR PATH, OR IS NAMED DIFFERENTLY
tesseract_cmd = 'tesseract'
RGB_MODE = 'RGB'
OSD_KEYS = {
'Page number': ('page_num', int),
'Orientation in degrees': ('orientation', int),
'Rotate': ('rotate', int),
'Orientation confidence': ('orientation_conf', float),
'Script': ('script', str),
'Script confidence': ('script_conf', float)
}
Я изменяю на tesseract_cmd = '/bin/tesseract'
, но это не сработало.
Любые предложения, пожалуйста.?