Мы столкнулись с одной проблемой: некоторые конечные точки находятся в состоянии «НЕИЗВЕСТНО».Работа Прометея "kubernetes-node".
Узлы и Prometheus работают в течение нескольких дней.Мы попытались свернуть те конечные точки «узлов kubernetes», которые находятся в состоянии «НЕИЗВЕСТНО».Метрики могут быть правильно свернуты, но состояние конечной точки все еще "НЕИЗВЕСТНО".Мы не знаем причину (критерии, в этом случае она будет помечена как «НЕИЗВЕСТНО»).
Я знаю, прежде чем Прометей сделает свою первую очистку, конечные точки находятся в состоянии «НЕИЗВЕСТНО».Затем, в случае успеха, конечная точка будет «ВВЕРХ», в случае неудачи - «ВНИЗ».Тем не менее, на скриншоте ниже кажется, что некоторые конечные точки никогда не очищаются ... Мы просто не знаем, почему.
Не могли бы вы дать совет, о возможной причине такого случая?Означает ли это, что этот узел (имя скрыто в красном блоке ...) имеет что-то не так?Если это так, можно ли это исправить, что позволит Прометею рассматривать его как «UP»?
Заранее спасибо.
- job_name: kubernetes-nodes
scrape_interval: 1m
scrape_timeout: 10s
metrics_path: /metrics
scheme: https
kubernetes_sd_configs:
- api_server: null
role: node
namespaces:
names: []
bearer_token_file: /var/run/secrets/kubernetes.io/serviceaccount/token
tls_config:
ca_file: /var/run/secrets/kubernetes.io/serviceaccount/ca.crt
insecure_skip_verify: true
relabel_configs:
- separator: ;
regex: __meta_kubernetes_node_label_(.+)
replacement: $1
action: labelmap
- separator: ;
regex: (.*)
target_label: __address__
replacement: kubernetes.default.svc:443
action: replace
- source_labels: [__meta_kubernetes_node_name]
separator: ;
regex: (.+)
target_label: __metrics_path__
replacement: /api/v1/nodes/${1}/proxy/metrics
action: replace
- source_labels: [__meta_kubernetes_namespace]
separator: ;
regex: (.*)
target_label: namespace
replacement: $1
action: replace