Во-первых, я хочу исправить вас со второй командой, которую вы упомянули.Это:
hdfs dfsadmin -report
Подходя к вопросу, почему результаты отличаются.Теперь команда du
показывает только данные, используемые на dfs, а не на тех, которые не используются dfs.С другой стороны, 2-я команда вычисляет общее пространство (dfs + non-dfs), а затем выдает подробную информацию об использованных данных.
Она также переносит реплицированный объем данных, т. Е. Если данные потребляют 5ТБ места и репликации 3, тогда dfs-use будет 15 ТБ.
Надеюсь, что очистит ваш запрос.