AWS pdfminer Время работы лямбды экспоненциально увеличивается при запуске события - PullRequest
0 голосов
/ 19 февраля 2020

Я создал лямбду для разбора PDF в строку, используя библиотеку pdfminer. Всякий раз, когда я запускаю свою лямбду вручную, лямбда выполняется за ~ 2000 миллис. Всякий раз, когда одна и та же лямбда вызывается событием, тот же код выполняется за ~ 27 700 миллисекунд.

Вот код моей функции синтаксического анализа:

def pdfToString(path):
    try:
        output_string = StringIO()
        with open(path, 'rb') as in_file:
            parser = PDFParser(in_file)
            doc = PDFDocument(parser)
            rsrcmgr = PDFResourceManager()
            device = TextConverter(rsrcmgr, output_string, laparams=LAParams())
            interpreter = PDFPageInterpreter(rsrcmgr, device)
            for page in PDFPage.create_pages(doc):
                interpreter.process_page(page)
        fileContent = output_string.getvalue()
        return deletePDFHeader(fileContent)
    except ClientError as e:
        logging.error(e)
        return 'NONE'

Этот метод вызывается из главного lambda_handler функция, и работа регистрируется с помощью функции date.time. Может ли кто-нибудь помочь мне понять, почему между этими двумя делами существует такой промежуток времени?

Спасибо, Привет

...