Я использую оператор Spark для запуска Spark в Kubernetes. (https://github.com/GoogleCloudPlatform/spark-on-k8s-operator)
Я пытаюсь запустить агент Java в драйверах Spark и модулях исполнителей и отправить метрики через службу Kubernetes оператору Prometheus.
Я использую этот пример https://github.com/GoogleCloudPlatform/spark-on-k8s-operator/blob/master/examples/spark-pi-prometheus.yaml
Java агент в течение короткого времени выставляет метрики на порт 8090 (я могу проверить это с помощью перенаправления портов kubctl port-forward < spark-driver-pod-name> 8090: 8090), также служба также предоставляет метрики в течение нескольких минут (можно проверить это с помощью перенаправления портов kubctl port-forward svc / 8090: 8090).
Promethues может зарегистрировать URL-адрес этого модуля в Prometheus, но когда он пытается очистить метрики (выполняется каждые 30 секунд), URL-адрес модуля недоступен.
Как сделать так, чтобы JMX-экспортер Java агента работал долго, пока драйвер и исполнители не завершат задание. не могли бы вы помочь мне здесь, кто сталкивался с этим сценарием раньше?