Hive или Pig - это уровень абстракции над заданиями Hadoop MapReduce, упрощающий создание / запуск заданий MR. Скрипты Pig и Hive просты в написании и автоматически конвертируются в MR Jobs.
Как и в случае любого уровня абстракции, сценарии Pig и Hive занимают значительно меньше времени для написания, чем MR Job в Java, но это немного накладные расходы. По мере того, как Свинья и Улей становятся все более зрелыми, этот разрыв сокращается.
Кевин количественно оценил свой опыт, он обнаружил, что обычно сценарий Pig составляет 5% кода нативной карты / редукции, написанного примерно в 5% времени. Однако для выполнения запросов обычно требуется от 110 до 150% времени, которое потребовалось бы для задания родного сопоставления / сокращения.
Подводя итог, Hive не обязателен, но он облегчит создание / запуск заданий MR для конечного пользователя с небольшими накладными расходами.