LIMIT доступно в Pig 0.9 в FOREACH nested_op .
Если вы хотите, чтобы верхний N-элемент каждой группы, вы можете попробовать выполнить итерациюна каждом и индивидуально сортируйте и ограничивайте их:
A = LOAD 'part-r-00000';
G = GROUP A by ($0, $2);
X = FOREACH G {
sorted = ORDER A by $0 ASC, $1 DESC;
lim = LIMIT sorted 3;
GENERATE lim;
};
DUMP X;
Обратите внимание, что TOP может быть эффективным, если у вас есть только столбец сопоставимых значений (не в этом случае).