На самом деле, на полномасштабной платформе Map / Reduce, такой как Hadoop , само хранилище данных распределено. Например, Hadoop имеет распределенную систему хранения файлов HDFS, которая обеспечивает как избыточность, так и высокую производительность. Узлы файловой системы могут использоваться в качестве вычислительных узлов или могут быть выделенными узлами хранения в зависимости от того, как была развернута инфраструктура.
Обычно при упоминании времени вычислений в этом случае предполагается, что входные данные уже существуют в распределенном хранилище кластера. Главный узел просто передает вычислительным узлам данные диапазонов для обработки, а не сами данные.