Посмотрите на Прометея Оператора.
https://github.com/coreos/prometheus-operator
Это настроит все необходимые модули для мониторинга ресурсов кластера kubernetes.
Вы даже можете определить правила, и если пороговые значения будут установлены, отправьте уведомление через менеджер предупреждений.
вам может понадобиться немного изменить некоторые службы, в частности, модуль с состоянием, например, Прометей. Он в значительной степени настроил бы панели мониторинга и все необходимое для просмотра метрик и просмотра того, что происходит в кластере k8s