Когда я запускаю mapreduce, я получаю объединенные входные записи больше, чем выходные записи карты? Это действительно странно. Я не мог понять, что именно происходит? Насколько я знаю, выходные данные карты должны быть точно такими же, как и входные записи объединения. Может ли кто-нибудь, пожалуйста, помогите мне разобраться в проблеме. Заранее спасибо.
Вот пример реальной работы:
Map-Reduce Framework
Map input records=112705844
Map output records=64841776
Combine input records=64842079
Combine output records=409
Reduce input records=106
Reduce output records=4