Борьба с процентилем запроса Прометея по статистике jvm - PullRequest
0 голосов
/ 26 марта 2019

Я пишу запрос, чтобы получить 95-й процентиль по скорости изменения в jvm_gc_collection_seconds_count. Я хочу вызвать оповещение при неожиданном всплеске. Цель состоит в том, чтобы отправить мне предупреждение, когда JVM работает усерднее, чем обычно.

Я использую jvm_memory_bytes_used для тестирования, так как скорость GC сейчас не показывает никаких аномалий. Ниже приведен пример данных, которые я получаю от jvm_memory_bytes_used. Если первые два верхних синих пика не будут возвращены в качестве точек данных? Нижняя красная линия обязательно должна восприниматься как аномалия.

sum of the rate of jvm_memory_bytes_used over 30 minutes

Я рассчитал сумму ставки за 30 минут, сгруппированную по экземплярам. С этим я пытаюсь получить 95-й процентиль.

histogram_quantile(0.95, sum(rate(jvm_memory_bytes_used[30m])) by (instance, le))

Я пытался снизить процентиль, но безрезультатно.

  1. Использую ли я правильную переменную для расчета статистики ГХ?
  2. Как мне получить histogram_quantile для получения результатов?
  3. Использую ли я правильный подход, используя процентиль для достижения своей цели?
...