Я пытаюсь передать файл «pdf» или «html» непосредственно в лямбда-функцию. Но я не понимаю, в каком правильном формате это должно быть получено?
Например: Я смог понять, как передавать файлы «изображений» через лямбда-функции, используя следующий код: Но как мне отправить файл pdf или html?
def write_to_file(save_path, data):
with open(save_path, "wb") as f:
f.write(base64.b64decode(data))
def ocr(img):
ocr_text = pytesseract.image_to_string(img, config = "eng")
return ocr_text
def lambda_handler(event, context=None):
write_to_file("/tmp/photo.jpg", event["body"])
im = Image.open("/tmp/photo.jpg")
try:
ocr_text = ocr(im)
except Exception as e:
print(e)
# Return the result data in json format
return {
"statusCode": 200,
"body": ocr_text
}
Изменить: я пытаюсь передать «pdf» или «html» напрямую через шлюз API (двоичный), а не через S3.