Как рассчитать «SLA» с метриками «черный ящик-экспортер» - PullRequest
0 голосов
/ 20 июня 2019

У меня есть экспортер черного ящика, который проверяет некоторые конечные точки HTTP. Я заметил, что он не использует (правильно) гистограммы, поэтому мне было интересно, как лучше рассчитать SLA для каждой конечной точки?

Например, скажем, я проверяю http://google.com, Я хотел бы рассчитать: - процент раз, когда я получил правильный ответ (probe_success) - процент случаев, когда ответ был получен в течение X миллисекунд

Я пытался использовать avg_over_time:

avg_over_time(probe_success{target="https://google.com"}[30d]

и деление на счет той же метрики, но я знаю, что это неправильно, а что-то отсутствует

1 Ответ

0 голосов
/ 21 июня 2019

avg_over_time(probe_success[1d]) даст вам соотношение между 0 (0%) и 1 (100%). Поэтому, если вам нужен процент из этого, умножьте на 100. Или установите его в Grafana (я думаю, это называется «процент (0,0 - 1,0)» или что-то в этом роде.

Если OTOH вам нужен процентиль для некоторой метрики, скажем, 90-процентного использования памяти, вы бы использовали что-то вроде quantile_over_time(0.9, memory_utilization[1d]).

...