Формат nagios.log - определение поля - PullRequest
0 голосов
/ 21 февраля 2019

Я искал около часа или около того.Я думал, что видел что-то здесь, но я не могу найти это.

Я ищу определение записи для nagios.log.Конкретно я пытаюсь выяснить, что представляет число.В этой записи я хочу понять, что такое «1».

[1549377065] СЕРВИСНОЕ ПРЕДУПРЕЖДЕНИЕ: esgg; HTTP; CRITICAL; SOFT; 1; CRITICAL - Тайм-аут сокета

Я думал навернякаэто было бы легко найти, но я ошибся или просто заблудился в лесу.

Ответы [ 2 ]

0 голосов
/ 25 февраля 2019

В определении службы Nagios вы установили «интервал проверки», «интервал повторных попыток» и «максимальное количество попыток проверки».Другими словами, nagios будет проверять сервис каждые check interval минут, а затем, если он не в порядке, он будет проверять снова каждые retry interval минут, для max check attempts раз.Число, на которое вы ссылаетесь, - это сколько раз Nagios проверял сервис с тех пор, как он перешел в состояние «не в порядке».Он будет увеличиваться до тех пор, пока не достигнет max check attempts или не вернется в состояние OK.

0 голосов
/ 21 февраля 2019

Это связано с механизмом soft & hard в Nagios.
Например, если для вашего сервиса esgg настроено max_check_attempts 3 в вашем определении сервиса, вы увидите что-то вроде этого:

[1549377065] SERVICE ALERT: esgg;HTTP;CRITICAL;SOFT;1;CRITICAL - Socket timeout
[1549377195] SERVICE ALERT: esgg;HTTP;CRITICAL;SOFT;2;CRITICAL - Socket timeout
[1549377265] SERVICE ALERT: esgg;HTTP;CRITICAL;HARD;3;CRITICAL - Socket timeout

Вам нужно 3 плохих непрерывных проверки, чтобы получить состояние HARD и уведомление.

...