Улучшите время отклика API на основе Tabula - PullRequest
0 голосов
/ 17 января 2020

Я разработал API, который анализирует данные из PDF. Я использовал tabula-py для разработки этого API, но на localhost это занимает 4-5 сек c, что намного дольше. Для уменьшения времени отклика я подумал использовать Azure -функцию, но она занимает намного больше времени, чем localhost (9-10 se c), что не ожидается.

Для ее развертывания я использовал docker изображение (ACR для Azure), которое, как я думал, поможет мне в масштабируемости. Может кто-нибудь предложить мне возможные способы сокращения времени отклика? Почему это занимает намного больше времени в Azure функции (что не ожидается)?

PS Azure Функция аналогична AWS Lambda.

1 Ответ

1 голос
/ 20 января 2020

tabula-py - это обертка вокруг tabula-java, которая написана в Java. Задержка, которую вы видите, представляет собой время запуска виртуальной машины Java, которая запускается оболочкой Python.

Оптимальным решением будет создание сервера API на языке, который работает на JVM, как Java или Kotlin.

...