У меня есть кластер Apache Ignite, который предоставляет метрики (как из кэша, так и из узлов)
Метрики обновляются со стандартным временем обновления Ignite, затем каждые 5 секунд я собираю эти метрики в Prometheus.
Что происходит, так это то, что некоторые из этих метрик всегда показывают значение 0, а другие показывают значимые значения.Вот пример:
Использование процессора и размер кэша
Здесь, на левом графике, я запрашиваю avg(ignite_average_cpu_load)
и avg(ignite_current_gc_cpu_load)
Первый правильнопоказанный, в то время как второй всегда сообщает 0 (примечание: если ошибка происходит, и Prometheys не собирает ничего, показывает нулевое значение, следовательно, сам Ignite, который дает мне это значение)
На правом графике более очевидно:Я вставляю ~ 25 Кбайт записи в кеш в секунду в момент скриншота.Но сроки не показаны.
Я активировал метрики в конфигурации кэша (до ignition.start()
) с помощью cacheConfiguration.setStatisticsEnabled(true)
и собираю их с
val clusterMetrics = ignite.cluster().forLocal().metrics()
и
val cacheMetrics = cache.localMetrics()
Узлом, которыйвызов cache.put НЕ тот же, что хранит сам кеш.Любые другие настройки остаются по умолчанию.Мой тик службы сбора каждые 5 секунд.
В чем может быть проблема?