у нас есть версия кластера ambari - 2.6.1 и hadoop version 2.6.4
число датодов - 10
с панели мониторинга ambari мы можем увидеть окно, показывающее следующее:
DataNodes Live
9/10
но через несколько минут все датододы оживают как:
DataNodes Live
10/10
и снова через несколько минут мы снова видим
DataNodes Live
9/10
кажется, что у наменода нетПолучил сообщение сердцебиения от датоде в течение более чем интервала, затем он будет помечен и как «мертвый»
мы проверим следующее:
- разрешение хоста - ОК (DNS в порядке)
- Разрешение IP - в порядке (DNS в порядке)
- Проверка службы HDFS прошла успешно
- Работает каждый датодан (ps -ef | grep datanode | grep -vgrep)
- netstat -anp |grep '0.0.0.0:50010' порт в порядке
- systemctl status firewalld.service (брандмауэр выключен, как и должно быть)
- sestatus Состояние SELinux (отключено)
- MTUнастроен на 9000 (и мы проверяем, что 9000 установлен правильно на всех компонентах
, что мы можем сделать еще для того, чтобы проверить, почему DataNode жива нестабильна?