В этой статье по состоянию на 2009 г. указано, что Pig работает в 1,5 раза медленнее, чем обычный MapReduce. Ожидается, что инструменты более высокого уровня, построенные поверх Hadoop, работают медленнее, чем обычный MapReduce, однако верно, что для оптимального выполнения MapReduce требуется опытный пользователь, который пишет много стандартного кода (например, двоичные компараторы).
Я считаю уместным упомянуть новый API под названием Pangool (разработчиком которого я являюсь), целью которого является замена простого Hadoop MapReduce API путем упрощения написания и понимания многих вещей ( вторичная сортировка, соединения со стороны уменьшения). Pangool не налагает накладных расходов на производительность (всего 5% по сравнению с первым тестом ) и сохраняет всю гибкость оригинального API MapRed.