Вот несколько советов и подсказок http://allthingshadoop.com/2010/04/28/map-reduce-tips-tricks-your-first-real-cluster/
Один пункт оттуда, о котором каждый разработчик должен знать:
В вашем Java-коде есть небольшая хитрость, чтобы помочь «осознать» задание в кластере задач, которые не являются мертвыми, а просто усердно работают. Во время выполнения задачи нет встроенного отчета о том, что задание выполняется должным образом, если оно не записывается. Таким образом, это означает, что если ваши задачи занимают много времени на выполнение работы, возможно, кластер увидит эту задачу как невыполненную (на основе настройки mapred.task.tracker.expiry.interval).
Не бойтесь, есть способ сказать кластеру, что ваша задача выполняется отлично. У вас есть 2 способа сделать это: вы можете либо сообщить о состоянии, либо увеличить счетчик. Оба из них приведут к тому, что средство отслеживания задач будет правильно знать, что задание выполнено нормально, и это будет видно по очереди. Обе эти опции описаны в JavaDoc http://hadoop.apache.org/common/docs/current/api/org/apache/hadoop/mapred/Reporter.html