Вы можете добавить новые узлы, просто загрузив новый с надлежащим hadoop-site.xml (тот, который указывает на главный namenode и jobtracker).
Тем не менее, удаление узлов - это действительно плохая идея без перебалансировки файловых блоков hdfs для предотвращения удаления всех дубликатов данного блока.
Если вы отбросите три datanodes, вы можете потерять все дубликаты для данного блока (который имеет репликацию 3, по умолчанию), что приведет к повреждению файла, которому принадлежит блок. Удаление двух узлов может оставить вас с одной репликой, и она может быть повреждена (известно, что это происходит с умирающими дисками).