Я развернул модель sklearn в AWS Sagemaker, используя метод sklearn.deploy
для автоматического масштабирования конечной точки. Я установил следующую конфигурацию:
Target value for number of requests: 25
Scale out cool time: 30 sec
Scale in cool time: 20 sec
После получения 25+ запросов развертывается новый экземпляр. Но после этого, даже когда я не отправляю новые запросы на конечную точку, масштаб автоматически не уменьшается.
Почему не уменьшается масштаб?
Как сделать так, чтобы оно автоматически уменьшалось при отсутствии новых запросов в течение фиксированного интервала времени.