Рассмотрение работы кластера хранения на основе HDFS и простой метод использования монтируемой системы HDFS в выпуске Cloudera.
Первый вопрос, который я задаю, заключается в том, обеспечит ли это автоматическую дедупликацию данных?
Второй вопрос, который я задаю, будет ли выполнена дедупликация, когда все пользователи удаляют файлы, содержащие определенный дедуплицированный блок, затем он фактически удаляет блок из хранилища или только индекс / ссылку для этого пользователя?
Наконец, будет ли этот метод включать методы сжатия Rainstor?
Спасибо за ваш вклад