Как определить дисковое пространство, используемое для определенного шаблона каталога, с помощью команды hdfs, не перечисляя все файлы в этом каталоге?
Как команду hdfs dfs -du -h
можно эффективно объединить с другой командой, чтобы получить дисковое пространство, используемое для конкретногошаблон каталога?
Пример, например: hdfs dfs -du -h /data/timestamp=201901*
должен дать мне место на диске, использованное для этого шаблона в январе 2019 г.?
hdfs dfs -du -h /data/timestamp=201901*
Configured Capacity: 12827080276992 (1 TB)
Present Capacity: 12729266364289 (0.5 TB)
DFS Remaining: 1671299095456 (0.5 TB)
DFS Used: 11057967268833 (10.06 TB)
DFS Used%: 46.07%
Under replicated blocks: 56
Blocks with corrupt replicas: 0
Missing blocks: 0
Missing blocks (with replication factor 1): 0