Если я правильно понял вашу ситуацию, вы хотели бы уменьшить масштаб кластера для экономии ресурсов.
Kubernetes поддерживает автоматическое масштабирование вашего приложения в кластере. Буквально это означает, что Kubernetes может запускать дополнительные поды при увеличении нагрузки и завершать избыточные поды при уменьшении нагрузки.
Можно уменьшить масштаб приложения до нуля, но, в этом случае у вас будет задержка обслуживания первого запроса при запуске модуля.
Эта функция зависит от показателей производительности. С практической точки зрения это означает, что автомасштабирование не происходит мгновенно, потому что требуется некоторое время, чтобы показатели производительности достигли настроенного порога.
Упомянутая функция Kubernetes под названием HPA (горизонтальное автоматическое масштабирование подов) описывается здесь документ .
В случае, если вы запускаете свой кластер на GCP или GKE, вы можете go дальше и автоматически запускать дополнительные узлы для вашего кластера, когда вам потребуется больше вычислительных мощностей, и выключить узлы, когда они больше не запускают модули приложений.
Более подробную информацию об этой функции можно найти по ссылке .
И последнее, но не менее важное: вы можете использовать инструмент например, Ansible для управления всеми вашими активами kubernetes (он может создавать / управлять развертываниями через playbooks).
Если вы решите попробовать, эта информация может оказаться полезной: