модель обнаружения объекта - подача тензорного потока - развертывание k8s: длительное время 3-4 секунды - PullRequest
0 голосов
/ 03 октября 2019

У меня есть модель обнаружения объектов TensorFlow, обслуживаемая TensorFlow и развернутая в кластере Azure Kubernetes. Я использовал устройство с графическим процессором Nvidia K80, с TensorFlow / Обслуживание: 1.12.3: версия GPU.

Модель развернута и отвечает правильно, но время отклика огромно, 3-4 секунды для изображений размером 500 * 375 - 135 КБ.

Может кто-нибудь помочь мне понять, что можно улучшить

1 Ответ

0 голосов
/ 14 октября 2019

Если это изображение является первым запросом прогнозирования, это нормальная ситуация. Вам может потребоваться запрос на разминку.

...