кластер амбари + плохое соединение между агентом амбари и сервером амбари - PullRequest
0 голосов
/ 06 мая 2020

у нас есть кластер амбари с 872 машинами с узлами данных, когда версия амбари - 2.6.x

у нас есть какая-то сетевая проблема,

после долгого исследования мы обнаружили, что агент амбари который работает на какой-то машине, плохо взаимодействует с сервером ambari

, поэтому мы получаем странное поведение в виде 5 мертвых узлов данных с панели управления ambari, , в то время как машина с датанодами наверняка исправна

можно ли указать более допустимое значение в конфигурации агента амбари, чтобы подтверждение между агентом амбари и сервером амбари происходило через более короткое время, чтобы игнорировать сетевые проблемы?

что-то вроде тайм-аута или временного соединения между агентом амбари и сервером амбари

Ответы [ 2 ]

0 голосов
/ 18 июля 2020

Прежде всего, вам нужно выяснить root причину проблемы, почему узел данных отображается как мертвый.

  1. Агент Ambari работает на каждом узле. Он отвечает за отправку показателей и пульса на сервер Ambari, который затем публикуется в вашем веб-интерфейсе Ambari.
  2. Узел имени ждет 10 минут, пока не объявит узел данных мертвым, и скопирует блоки на другие узлы данных. .
  3. Если он показывает, что узел данных мертв, проверьте статус агента Ambari в указанном узле c, запустив- service ambari-agent status. Параллельно вы можете проверить ambari-agent.log, чтобы узнать, почему перестал работать агент Ambari.
0 голосов
/ 10 мая 2020

Вы можете настроить тайм-ауты HTTP в амбари-агентах для служебных задач, таймауты HTTP

https://github.com/apache/ambari/blob/trunk/ambari-agent/conf/unix/ambari-agent.ini

Есть раздел HTTP-тайм-аут, который вы можете настроить на основе на пропускную способность вашей сети.

Файл должен находиться в /etc/ambari-agent/ambari.properties

...