Входные данные вместе с функцией карты будут переданы менеджеру ресурсов.
Расположение данных будет предоставлено RM, так что любые чтения будут размещены первымикак NODE_LOCAL.Сами данные не перемещаются из узла данных до тех пор, пока не потребуется удаленное чтение.
где находится этот формат ввода
Сам класс находится на путях, показанных hadoop classpath
.Разделение - это не отдельный объект данных, а только маркер границы в файле HDFS.
- это разделение входных данных, выполненное до того, как задача назначена диспетчеру узлов, или это делается после того, как задача назначена диспетчеру узлов.
Разделения вычисляются до ресурсовможно выделить.Количество разбиений определяет количество картографов