У меня есть модель на мл-движке google cloud, в основном состоящая из реализации keras нейронной сети VGG19 (даже без полностью связанных слоев в верхней части). Точнее, размер изображения сначала изменяется с помощью tf.image.resize_images
, а затем проходит через VGG со средними активациями объектов, рассчитанными в 5 различных слоях.
При запуске из терминала как
gcloud ml-engine predict \
--model Features \
--version v1 \
--json-instances \
test_image.json
все время выполнения составляет примерно 17-18 секунд (не при первом запуске).
Похоже, что это намного медленнее, чем следует пройти через VGG. Есть ли у вас какие-либо идеи относительно того, что может быть причиной этого?