Когда мы добавляем файлы с
bin / hadoop dfs -put input_folder input
по этой команде в HDFS.
Когда мы добавляем файлы, они реплицируются на все узлы.
Есть ли способ, с помощью которого мы можем распространять разные файлы на разных узлах, значит, предположим, у меня есть 4 файла A, B, C, D. Я добавлю файлы A и B на узел 1 и оставлю на узле 2.
Возможен ли этот сценарий?
Если да, то что происходит в случае сбоя узла?