Как ведет себя kubernetes HPA с 2 или более метриками - особенно подсчет количества реплик? - PullRequest
0 голосов
/ 22 января 2019

Мы настроили использовать 2 метрики для HPA

  1. Загрузка ЦП
  2. Пользовательские метрики для приложений

При тестировании мы наблюдали масштабирование, но подсчет количества реплик не очень понятен.Я не могу найти какую-либо документацию по этому вопросу.

Вопросы:

  1. Может ли кто-нибудь указать на документацию или код в части расчета?
  2. Является ли хорошей практикой использование нескольких метрик для масштабирования?

Заранее спасибо!

1 Ответ

0 голосов
/ 22 января 2019

С https://kubernetes.io/docs/tasks/run-application/horizontal-pod-autoscale/#how-does-the-horizontal-pod-autoscaler-work

Если в HorizontalPodAutoscaler указано несколько метрик, этот расчет выполняется для каждой метрики, а затем выбирается наибольшее из желаемых подсчетов реплик. Если ни одна из этих метрик не может быть преобразована в желаемое количество реплик (например, из-за ошибки при выборке метрик из API метрик), масштабирование пропускается.

Наконец, непосредственно перед тем, как HPA масштабирует цель, записывается рекомендация по масштабированию. Контроллер учитывает все рекомендации в настраиваемом окне, выбирая самую высокую рекомендацию из этого окна. Это значение можно настроить с помощью флага --horizontal-pod-autoscaler-downscale-stabilization-window, который по умолчанию равен 5 минутам. Это означает, что масштабирование будет происходить постепенно, сглаживая влияние быстро меняющихся значений метрики

...