Сброс пассивной службы Nagios 4.4.2 на OK - PullRequest
0 голосов
/ 28 января 2019

У меня есть пассивная служба, которая не работает, как я надеялся / ожидал.Это асинхронный сервис.Он отправляет пассивное сообщение NRDP при изменении состояния.Таким образом, если сигнал тревоги сработал, он отправляет предупреждающее сообщение, а когда сигнал тревоги исправлен, состояние изменяется и отправляет сообщение OK.В случае тревоги ответственное лицо получает уведомление о проблеме.

Проблема заключается в том, что после 3-минутного порога свежести он возвращается в состояние nagios обратно в состояние OK и уведомление ответственного лица отправляется ответственному лицу (согласно странице уведомлений).В статье, которую я прочитал, я думал, что она станет критической (но, возможно, активной).

Моя конфигурация кэша службы выглядит следующим образом:

define service {
        host_name       sensorshost
        service_description     sensor-116
        display_name    sensor-116
        check_period    24x7
        check_command   check_dummy!0
        contact_groups  sensor-116-contact-group
        notification_period     24x7
        initial_state   o
        importance      0
        check_interval  5.000000
        retry_interval  1.000000
        max_check_attempts      1
        is_volatile     0
        parallelize_check       1
        active_checks_enabled   0
        passive_checks_enabled  1
        obsess  1
        event_handler_enabled   1
        low_flap_threshold      0.000000
        high_flap_threshold     0.000000
        flap_detection_enabled  0
        flap_detection_options  a
        freshness_threshold     180
        check_freshness 1
        notification_options    r,w,u,c
        notifications_enabled   1
        notification_interval   60.000000
        first_notification_delay        0.000000
        stalking_options        n
        process_perf_data       1
        retain_status_information       1
        retain_nonstatus_information    1
        }

1 Ответ

0 голосов
/ 28 января 2019

Хорошее место для начала - документация Nagios :

Как работает проверка свежести?

Nagios периодически проверяет свежесть результатов длявсе службы хостов, для которых включена проверка свежести.

  • Порог свежести рассчитывается для каждого хоста или службы.
  • Для каждого хоста / службы сравнивается возраст последнего результата проверкис порогом свежести.
  • Если возраст последнего результата проверки превышает порог свежести, результат проверки считается устаревшим.
  • Если результаты проверки признаны устаревшимиNagios принудительно выполнит активную проверку хоста или службы, выполнив команду, указанную в определении хоста или службы.

Совет: Активная проверка выполняется, даже если она активнапроверки отключены для всей программы, хоста или службы.

В вашем случае, если результат пассивной проверки старше 180 time-unit (обычно секунды, но это настраивается), затем будет запущена «активная проверка» (т. е. ваш check_command), чтобы попытаться исправить ситуацию.

Nagios отображает коды выхода в состояния обслуживания,поэтому, если check_dummy!0 завершается с кодом 0, это объясняет, почему служба возвращается к OK.

...