Есть ли способ перераспределения данных непосредственно в HDFS?Если вы заметили, что ваши разделы несбалансированы (один или несколько гораздо больше других), как вы можете с этим справиться?
Я знаю, что это можно сделать ex в Apache Spark, но кажется, что выполнение задания просто перераспределениекак накладные расходы - или, может быть, это хорошая идея?