У меня есть кластер Apache Hadoop. Один из узлов столкнулся с перекошенным распределением данных. Машина имеет 3 диска. диск 1 занял около 86%, диск 2 30% и диск 3 60% соответственно. Теперь, что делать, если данные неравномерно распределены между дисками в пределах DataNode? П.С .: Я хотел бы сообщить вам, что тип хранилища НЕ одинаков, поэтому я не могу следовать HDFS-1312. Кроме того, моя версия Hadoop 2.5.0. любая помощь?
Балансировщик интранода был представлен в Hadoop3.
Я не уверен, что есть альтернатива без перемещения по файлам самостоятельно, что может быть опасно, даже если он думает, что наменод отслеживает только датодуду, а не объемы данных