Вы показываете датоды с dfsreport, а не менеджеры узлов, которые на самом деле обрабатывают данные.В пользовательском интерфейсе YARN вы захотите обратить внимание на счетчик «Активные узлы», который в вашем случае равен 1 .Это имело бы смысл, если ведущим является менеджер по наменоду и ресурсам, в то время как ведомое устройство будет управлять данными и нодами.
Кроме этого, если у вас есть неразборный файл, например ZIP, или размер вашего файла меньше размера блока (по умолчанию 128 МБ), то только один преобразователь будет обрабатывать его.Кроме того, не гарантируется, что мапперы (или редукторы) будут распределены равномерно по всем доступным ресурсам
Вне среды обучения, однако, 40 ГБ памяти и 8 ГБ ОЗУ лучше потратить на многопоточностьчем распределенные вычисления (или надлежащая база данных; т.е. разбирать файлы и загружать их в запрашиваемое хранилище).Или используйте Spark или Pig, которые не требуют Hadoop, но с которыми гораздо проще работать, чем MapReduce