как понять результаты hdfs -du - PullRequest
0 голосов
/ 18 сентября 2018

Я пытаюсь использовать команду hdfs dfs - du -h для отображения размера файлов и папок. Команда, которую я использую, - hdfs dfs - du -h /path_name/folder_name, возвращаемый результат -

9.2 G   27.5 G  /path_name/folder_name/xxx01.parquet
0       0       /path_name/folder_name/xxx02.parquet
19.9 M  59.6 M  /path_name/folder_name/xxx03.parquet

Я знаю, что командная строка hadoop много заимствует из общей команды файловой системы, а -du -h - это список удобочитаемой папки / размера файла. Однако (возьмите первую строку результата в качестве примера), что означает эти два числа 9.2 G 27.5 G соответственно?

Спасибо!

1 Ответ

0 голосов
/ 18 сентября 2018

Ваш коэффициент репликации кластера равен 3. Первое число - это чистый размер файла, а второе - размер файла с репами. например фактический размер файла составляет 9,2 ГБ. Поскольку коэффициент репликации равен 3, размер файла с репликами составляет 27,5 ГБ

.
size      disk space consumed with all replicas full_path
Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...