Допустим, у меня есть таблица со следующими столбцами (A, B, C)
Как бы я написал оператор pig для создания группы по столбцу (A).И затем фильтр, где count (столбец B> 100) и количество (отличный (столбец C)> 3)?
Из того, что у меня есть:
Сначала я удалил счет, где B меньше 100
filter_column = FILTER data by b > 100;
Затем сделал группу на A:
group_1 = GROUP filter_column by A;
Как бы я теперь отфильтровал эту группу_1, где количество различных значений в столбце C> 3?