Я пытаюсь отслеживать и контролировать, сколько времени требуется модулю, чтобы он подключился / исправен / запущен.
Я использую EKS. В моем кластере установлены HPA и cluster-autoscaler.
Допустим, у меня есть развертывание с политикой масштабирования HorizontalPodAutoscaler
с 70% targetAverageUtilization
.
Таким образом, когда среднее использование развертывания будет go при превышении 70% HPA инициирует создание нового POD. Теперь, в зависимости от различных факторов, например, доступны ли узлы или нет, а если они еще не доступны, то изображение необходимо загрузить или оно присутствует в кеше, масштабирование может занять от нескольких секунд до нескольких минут.
Я хочу отслеживать это время / продолжительность, каждый раз, когда POD планируется, сколько времени требуется, чтобы прийти в состояние Running
. Какие-либо предложения?
Или в любом направлении, куда я должен смотреть.
Я нашел это Журналы видимости кластерного автомасштабирования , но это доступно только в GCE.
Я ищу любое решение, будь то интеграция «из коробки» или создание событий и их сохранение в БД временных рядов или удаление данных из Prometheus. Но до сих пор я не мог найти для этого никакого решения.
Заранее спасибо.