В кластере AWS Elastic MapReduce как я могу увеличить коэффициент репликации до числа больше 1?Вопросы о том, как это сделать в HDFS, в целом говорят, что вы можете использовать команду вроде:
hadoop fs -setrep -R 3 input
, чтобы установить репликацию для файла «input» на 3. Но, похоже, это ничего не делает, когдаЯ ssh'ed на мастер-узел.
У меня есть относительно небольшой набор данных, который я использую для нескольких заданий, так что в конечном итоге это сэкономило бы время для его репликации на каждом узле данных.