Поместите файл в HDFS и прочитайте файл, используя HDFS API в функции картографирования, и выполните его обработку. Вы также можете попробовать DistributedCache вместо помещения файла в HDFS.
Этот сценарий также применим, когда необходимо выполнить N имитаций для набора данных. Факторы моделирования будут входными данными для функции карты, а фактические данные считываются в функции карты.