Как управлять назначением файлов в различных ведомых в распределенной системе hadoop? - PullRequest
3 голосов
/ 21 сентября 2011
  1. Как управлять назначением файлов в разных ведомых в распределенной системе hadoop?
  2. Можно ли записать 2 или более файла в hadoop одновременно с задачей уменьшения карты?

Я новичок в hadoop. Это будет очень полезно для меня. Если вы знаете, пожалуйста, ответьте.

1 Ответ

0 голосов
/ 21 сентября 2011

Это мой ответ для вашего # 1:

Вы не можете напрямую контролировать, куда идут задачи карты в вашем кластере или куда файлы отправляются в вашем кластере.JobTracker и NameNode обрабатывают их соответственно.JobTracker попытается отправить задачи карты в локальные данные, чтобы повысить производительность.(Я должен был догадаться, что вы имели в виду для вашего вопроса, если я не понял его правильно, уточните)

Это мой ответ для вашего # 2:

MultipleOutputs - это то, что вы ищете, когда хотите записать несколько файлов из одного редуктора.

Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...