Я создал лямбду для разбора PDF в строку, используя библиотеку pdfminer. Всякий раз, когда я запускаю свою лямбду вручную, лямбда выполняется за ~ 2000 миллис. Всякий раз, когда одна и та же лямбда вызывается событием, тот же код выполняется за ~ 27 700 миллисекунд.
Вот код моей функции синтаксического анализа:
def pdfToString(path):
try:
output_string = StringIO()
with open(path, 'rb') as in_file:
parser = PDFParser(in_file)
doc = PDFDocument(parser)
rsrcmgr = PDFResourceManager()
device = TextConverter(rsrcmgr, output_string, laparams=LAParams())
interpreter = PDFPageInterpreter(rsrcmgr, device)
for page in PDFPage.create_pages(doc):
interpreter.process_page(page)
fileContent = output_string.getvalue()
return deletePDFHeader(fileContent)
except ClientError as e:
logging.error(e)
return 'NONE'
Этот метод вызывается из главного lambda_handler функция, и работа регистрируется с помощью функции date.time. Может ли кто-нибудь помочь мне понять, почему между этими двумя делами существует такой промежуток времени?
Спасибо, Привет