В настоящее время я развертываю экземпляры графического процессора и масштабирую их в соответствии с рабочим циклом.Но это не совсем хороший показатель.
У нас есть развертывание, использующее gpu.И он предоставляет API отдыха, где другие задания / модули могут использовать его для выполнения вывода.Как я могу эффективно масштабировать их с помощью hpa?На основании какой метрики?
В настоящее время я пытаюсь использовать метрику коэффициента заполнения, но она не очень надежна.
Редактировать: Нет, этот вопрос не является дубликатом Автоматическое масштабирование на основе использования графического процессора.Я ищу метрику Куберне, чтобы включить автоматическое масштабирование.