У вас интересная конфигурация.Каким будет дисковый ввод-вывод для используемого хранилища NAS?
Примите решение, основываясь на следующем: парадигма Map Reduce используется для решения проблемы обработки большого количества данных.По сути, оперативная память дороже, чем дисковое хранилище.Вы не можете хранить все данные в оперативной памяти.Дисковое хранилище позволяет хранить большие объемы данных с меньшими затратами.Но скорость чтения данных с дисков не очень высока.Как Map Reduce решает эту проблему?Map Reduce решает эту проблему, распределяя данные по нескольким машинам.Теперь скорость параллельного чтения данных выше, чем вы могли бы сделать с одним диском хранения.Предположим, что скорость дискового ввода-вывода составляет 100 Мбит / с.С помощью 100 машин вы можете читать данные со скоростью 100 * 100 Мбит / с = 10 Гбит / с.
Обычно скорость процессора не является узким местом.Скорее всего, дисковые операции ввода-вывода являются большими узкими местами при обработке большого количества данных.
У меня такое ощущение, что это может быть не очень эффективно.