Нужно сгруппировать по одному столбцу и добавить счетчик другого столбца в Hive. - PullRequest
0 голосов
/ 16 апреля 2020

Вот примерные данные, которые у меня есть:

input

в приведенной выше таблице, мы можем видеть a1, a2, a3 и a4, все с src1. В результате мне нужны только a3 и a4, так как это единственные строки, в которые встроен только src1. a1 и a2 имеют другие src2, ... et c.

Мне нужен запрос улья, чтобы получить результат.

1 Ответ

1 голос
/ 16 апреля 2020

Вы можете агрегировать по col1 и использовать условие having для фильтрации по col1 s, чье единственное значение для col2 равно 'src1'.

select col1
from mytable
group by col1
having min(col2) = max(col2) and min(col2) = 'src1'
...