Масштабирующее устройство GKE масштабируется только тогда, когда есть запланированные модули, которые не работают ни на каких текущих узлах, а увеличение позволит запланировать модуль.
Уменьшение происходит, когда узел использует меньше чем половина, это общая память и ЦП, и все модули, работающие на узле, могут быть запланированы на другом узле.
При этом автоскалер никогда не уменьшит кластер до 0, так как для этого могут потребоваться ' быть встреченным
Однако вы можете настроить Горизонтальное автоматическое масштабирование модуля для развертывания приложения. Вы можете настроить HPA для увеличения или уменьшения в зависимости от количества HTTP-запросов с использованием пользовательского показателя c. Несмотря на это, HPA также не следует масштабировать развертывание до нуля и не увеличивать с 0.
Если вы правильно сконфигурируете HPA, включите автоматическое масштабирование кластера и спланируете, как ваши модули будут развернуты используя портит, допуски и сходство , вы можете оптимизировать автоматическое масштабирование так, чтобы ваш кластер уменьшился до минимального размера. Но это все равно не будет 0.
При всем этом, если вы используете простое приложение с увеличенным временем простоя, вы можете рассмотреть возможность использования Cloud Run или App Engine, так как ими будет легче управлять, чем GKE и будет иметь гораздо меньше накладных расходов (и, вероятно, меньше затрат).