Мне нужно взять среднее значение третьего столбца, если первый и второй столбцы совпадают.
Пример ввода: {1, 10, 11}, {1,10, 12} , {2, 5, 7}, {2, 5, 8}, {2, 5, 12} {3, 6, 10}
Я понимаю функции GROUP By
и AVG
. можно использовать, но не уверен, как использовать его в вышеуказанном контексте.
B = GROUP A BY name;
C = FOREACH B GENERATE A.name, AVG(A.gpa); ```
Expected : {1,10, 11.5}, {2, 5, 9}, {3, 6, 10}