1) Так как NameNode не позволяет узлам DataNode иметь несколько реплик одного и того же блока, максимальное число созданных реплик - это общее количество узлов DataNode в то время.
Ссылка: https://hadoop.apache.org/docs/r3.1.1/hadoop-project-dist/hadoop-hdfs/HdfsDesign.html#Simple_Coherency_Model(В разделе «Размещение реплики: первые шаги ребенка»)
Это означает, что если у вас есть 2 датоды, ваш коэффициент репликации не может быть 3.
2) Размер файла будет таким же.Однако использование трех реплик увеличит ваши затраты на хранение.Я имею в виду, что если ваш файл 2 ГБ.Вы храните свой файл, используя 3 реплики.Это означает, что вы выделяете 6 ГБ (2 ГБ для исходного файла и 2 + 2 ГБ для копий) для хранения вашего файла.