Мне было интересно изменить способ разделения входных данных заданий на конкретные узлы.
Я просмотрел код Hadoop в JobInprogress, но не смог узнать, как происходит фактическое распределение.
Как входные разбиения задания распределяются по узлам кластера?
Какие файлы Hadoop мне нужны, чтобы понять распределение?