У меня есть несколько вопросов по выполнению заданий PIG Script / Map-Reduce.
Я знаю, что pig создает логические, физические, а затем планы выполнения до того, как она действительно начнет выполнять задание карты / сокращения; Я могу посмотреть на логические / физические планы, используя команду объяснение <псевдоним_символа> ; Но как мне просмотреть план выполнения (который я предполагаю перечислить другую карту / сократить запланированные задачи)? В ходе выполнения свиньи я вижу, что создано много заданий (карта / уменьшение пары). Хотите понять, что решает каждое из этих заданий.
Есть ли какое-то определенное руководство, которое я могу использовать, чтобы понять созданные планы, потому что трудно понять, что такое размолвка.
Я могу изменить количество заданий на карте, изменив количество блоков входного файла. Могу ли я контролировать количество сокращенных рабочих мест? Как установить количество редукторов?
Каков размер кучи памяти по умолчанию в узлах картографа / редуктора? Какие параметры работы отражают это? Смогу ли я изменить кучу памяти с помощью опции -Xmx 1024m ? Мои задания раньше не работали, когда я настраивал кучную память таким образом - может быть, есть некоторые ограничения на то, какие значения могут быть предоставлены?
Большое спасибо!