Я не смог найти никакой документации о том, как hadoop обрабатывает разлитые записи.Есть ли ссылка, которую можно найти в Интернете.
Спасибо за ваше время.
Проверьте http://hadoop.apache.org/common/docs/r0.20.2/mapred_tutorial.html#Map+Parameters и раздел прямо под ним http://hadoop.apache.org/common/docs/r0.20.2/mapred_tutorial.html#Shuffle%2FReduce+Parameters
Я не уверен, охватывает ли это то, что вы ищете, но, надеюсь, это укажет вам направление, чтобы начать искать еще немного.