Использование диска с данными архива hdfs меньше ожидаемого - PullRequest
0 голосов
/ 06 февраля 2019

У меня есть кластер Cloudera HDFS, который составляет 17,5 т (52,4 т с 3-кратной репликацией).Он охватывает 10 или около того узлов и 1 узел архива данных.Архив настроен как архив АКА холодного хранения.Все данные там реплицируются вскоре после создания в качестве защиты восстановления данных первой линии.Ссылка: https://hadoop.apache.org/docs/current/hadoop-project-dist/hadoop-hdfs/ArchivalStorage.html

Cloudera сообщает, что общее использование диска на узле архива составляет всего 5,7 ТБ.Значительно меньше, чем 17,5 ТБ, я бы ожидал.Здесь происходит что-то еще, чего я просто не понимаю?Есть ли способ проверить, что архивное хранилище работает правильно?

...