Если это производственная среда, рекомендуется избегать серверов (серверов) NameNode, серверов (ов) Resource Manager, узлов журналов и узлов данных. Это оставляет вас с краевым узлом.
Процесс будет следующим:
1) Установите клиент Hadoop.
2) Установить Flume
3) Сконфигурируйте flume в файле flume.conf (или любом другом имени, которое вы хотите дать). Вы можете найти множество примеров конфигураций онлайн.
4) Сделайте тип мониторинга = http для быстрой проверки данных о производительности.
5) Откройте порты для источников и приемников.
5) Запустите агент.
6) Проверьте журнал агента, чтобы увидеть все запущенные компоненты.
7) Попробуйте отправить пример данных и проверьте, достигает ли он пункта назначения.
8) Отладка любых сбоев.
Дайте мне знать, если вам нужна дополнительная информация.