Перестали работать ловушки OpenNMS SNMP - как устранить неполадки - PullRequest
0 голосов
/ 11 ноября 2018

Около 5 дней назад OpenNMS Horizon 22.02 в Ubuntu 18.04.1 LTS прекратил принимать ловушки от элементов сети. Насколько мне известно, в конфигурацию или базовую операционную систему не было внесено никаких изменений.

Существует около 125 сетевых элементов, все Cisco, отправляющие ловушки.

Пока я проверил следующее:

  • tcpdump показывает ловушки, поступающие в интерфейс через порт 162
  • Включен Debug для trapd.log и входящие прерывания от сетевых элементов не создают никаких записей журнала
  • Ловушки, отправляемые с помощью send-trap.pl с локального хоста, создают ловушки, которые перетекают в события
  • Ловушки, отправленные с помощью snmptrap либо на локальный хост, либо на другой хост, создают записи в журнале, которые перенаправляются на события. Другой хост использует тот же интерфейс, который используют элементы сети.
  • ss -lnpu sport =: 162 показывает открытый UPD "UNCONN"
  • sudo lsof -i: 162 показывает java-процесс с одним слушателем
  • При запуске trapd не отображаются предупреждения в журнале
  • Я убедился, что ufw и iptables выключены
  • Я обновил OpenNMS до 22.04 и обновил Ubunutu без помощи
  • Перезапускал OpenNMS много раз ...
  • Я переместил запуск Trapd после Asterisk в service-configuration.xml на основе this

Все это похоже на this . Я думаю, что последний комментатор в этой теме спросил о сравнении успешных и неудачных ловушек в Wireshark, которые я не сделал, но все отправляемые ловушки работали сотни, если не тысячи раз, до 6 ноября.

Есть ли где-нибудь еще, где искать ошибки, почему Trapd не принимает ловушки? Я думаю, что я исключил проблемы с сетью.

Я создал новую виртуальную машину Ubuntu 18.04, обновил ее, а затем установил Horizon 23.01 fresh. Я направил на него свой поток ловушек, и он ведет себя точно так же, ни одна из ловушек не создает никаких записей в журнале trapd.log с уровнем, установленным для отладки. Tcpdump показывает ловушки, поступающие на интерфейс.

1 Ответ

0 голосов
/ 12 ноября 2018

Проблема решена.

Базовая операционная система потеряла статический маршрут для подсети, из которой исходили ловушки. У OpenNMS был маршрут обратно в подсеть, но не через путь, по которому приходили ловушки. Как только статический маршрут был восстановлен, ловушки снова заработали и начали течь вплоть до событий.

...