Как вычислить сумму поля во всех строках из псевдонима - PullRequest
6 голосов
/ 28 марта 2012

Что я хочу сделать, это суммировать значения поля во всех строках в псевдониме.Это должно быть просто, но почему-то я не могу найти ответ.Вероятно, это потому, что мне нужно скалярное значение, в то время как PIG обрабатывает наборы данных?Я думаю, я могу создать строку с полем, которое является суммой?Пожалуйста, порекомендуйте!

1 Ответ

13 голосов
/ 28 марта 2012

Этого можно достичь, используя GROUP ALL, чтобы объединить все в одну группу, а затем функцию SUM, чтобы сложить все поля:

DESCRIBE a
a: (name, age, height)

b = GROUP a ALL;
c = FOREACH b GENERATE SUM(a.age);
...