Необходимость мгновенного сокращения узлов, Kubernetes не позволяет разработчикам настраивать время до того, как узлы уменьшаются. В настоящее время значение по умолчанию составляет 10 минут.
Я занимаюсь разработкой приложения, которое требует много вычислительной мощности / часов. Я смотрю на запуск процесса A, который добавляет некоторые задачи в очередь заданий. Каждое из заданий 'требует в среднем 10-40 минут для обработки на экземпляре 6vCPU и 24 ГБ.
Когда вы применяете kubectl scale deployment <deployment-name>
, он мгновенно уменьшает размеры стручков. Однако базовый узел будет уменьшаться только в том случае, если вычислительная мощность не использовалась в течение 10 минут.
Есть ли способ настроить это время ожидания? Стоит ли связываться с Google GKE или Kubernetes, чтобы разрешить исключение для моего конкретного варианта использования?
Я также попытался убить сам узел из модуля после обработки и прошел успешно, однако Kubernetes воссоздает удаленный экземпляр, поэтому моя попытка оказалась бесполезной.
Любой совет будет оценен.
kubectl scale deployments mydeployment --replica=0
Actual: Уменьшает стручки сразу, но через 10 минут масштабирует нижележащий узел.
Требуется: мгновенно уменьшает вес модулей и узлов.