запрос Прометея для непрерывной работы - PullRequest
0 голосов
/ 02 марта 2019

Я новичок в Prometheus и пытаюсь найти правильный запрос для получения последнего непрерывного времени безотказной работы моего сервиса.

Например, если настоящее время 0:01:20 мой сервисбыл в 0:00:00, спустился в 0:01:01 и снова поднялся в 0:01:10, я бы хотел увидеть время безотказной работы "10 секунд".

I 'Я в основном смотрю на метрику "up {}" и, возможно, объединяю ее с функциями (changes (), rate () и т. д.), но пока не повезло.Я не вижу никакой другой метрики прометея, похожей на «вверх».

1 Ответ

0 голосов
/ 04 марта 2019

Проблема в том, что вам нужно что-то, что говорит о том, когда ваша служба фактически работала, и о том, работал ли узел:)
Мы используем следующее (надеюсь, одна поможет или общая идея каждого из них):
1. Когда мы смотрим на хост, мы используем node_time{...} - node_boot_time{...}
2. Когда мы смотрим на конкретный процесс / контейнер (в нашем случае докер через cadvisor), мы используем node_time{...} - on(instance) group_right container_start_time_seconds{name=~"..."}) by(name,instance)

...