Мне любопытно узнать, что на самом деле делает команда model.deploy в фоновом режиме при реализации в блокноте aws sagemaker, например: Forextor = Sagemaker_model.deploy (initial_instance_count = 9, instance_type = 'ml.c5.xlarge')
, а также во время автоматического масштабирования конечной точки sagemaker того, что происходит в фоновом режиме, для запуска новых экземпляров требуется много времени, почти 10 минут, из-за чего большинство запросов отбрасывается. или не обрабатывается, а также получает тайм-аут соединения во время нагрузочного тестирования бросил JMeter. В sagemaker есть какой-нибудь способ быстрой загрузки или золотой AMI?
Существуют ли другие способы решения этой проблемы?