Прежде всего, загрузка ЦП 80% - это не порог, а целевое значение.
Алгоритм HPA для расчета требуемого количества реплик основан на следующей формуле:
X = N * (C/T)
Где:
X
: желаемое количество реплик N
:текущее количество реплик C
: текущее значение метрики T
: целевое значение для метрики
Другими словами, алгоритм стремитсяпри подсчете количества реплик, которые сохраняют наблюдаемое значение метрики как можно ближе к целевому значению.
В вашем случае это означает, что если средняя загрузка ЦП в модулях вашего приложения ниже 80%, HPAимеет тенденцию уменьшать количество реплик (чтобы увеличить загрузку процессора оставшимися модулями). С другой стороны, если средняя загрузка ЦП по модулям превышает 80%, HPA имеет тенденцию увеличивать количество реплик, так что использование ЦП отдельными модулями уменьшается.
Количество реплик, которыеДобавление или удаление за один шаг зависит от того, насколько далеко текущее значение метрики находится от целевого значения, а также от текущего числа реплик. Это решение является внутренним для алгоритма HPA, и вы не можете напрямую влиять на него. Единственный контракт, который HPA заключает со своими пользователями, заключается в том, чтобы поддерживать значение метрики как можно ближе к целевому значению.
Если вам нужно очень специфическое поведение автоматического масштабирования, вы можете написать собственный контроллер (или оператор)для автоматического масштабирования вашего приложения вместо использования HPA.