У меня есть конечная точка, развернутая в SageMaker с моделью Tensorflow, и я звоню ей, используя Scala SDK, например:
runtime = AmazonSageMakerRuntimeClientBuilder
.standard()
.withCredentials(credentialsProvider)
.build()
...
val invokeEndpointResult = runtime.invokeEndpoint(request);
Могу ли я использовать Elasti c Sagemaker с этим код как есть и получить повышение производительности EI? Я попытался запустить конечную точку с конфигурацией 8 ml.m5d.xlarge против конфигурации с 8 ml.m5d.xlarge экземплярами с добавленным EI ml.eia2.xlarge, но, глядя на показатели наблюдения за облаком, я получаю то же число количество вызовов в минуту, а общее время выполнения (на одном входе) одинаково.