Масштабирование развертываний с использованием gpu по требованию - PullRequest
0 голосов
/ 18 июня 2019

В настоящее время я развертываю экземпляры графического процессора и масштабирую их в соответствии с рабочим циклом.Но это не совсем хороший показатель.

У нас есть развертывание, использующее gpu.И он предоставляет API отдыха, где другие задания / модули могут использовать его для выполнения вывода.Как я могу эффективно масштабировать их с помощью hpa?На основании какой метрики?

В настоящее время я пытаюсь использовать метрику коэффициента заполнения, но она не очень надежна.

Редактировать: Нет, этот вопрос не является дубликатом Автоматическое масштабирование на основе использования графического процессора.Я ищу метрику Куберне, чтобы включить автоматическое масштабирование.

...