Различаются по конкретному столбцу в улье - PullRequest
4 голосов
/ 13 сентября 2011

У меня работает Hive 071 У меня есть таблица с несколькими строками, с тем же значением столбца, например,

|х |у |


|1 |2 |
|1 |3 |
|1 |4 |
|2 |2 |
|3 |2 |
|3 |1 |

Я хочу, чтобы столбец x был уникальным, и удалял строки с одинаковым значением x val, например

|х |у |


|1 |2 |
|2 |2 |
|3 |2 |

или

|х |у |


|1 |4 |
|2 |2 |
|3 |1 |

оба хороши как отдельные работы только для всего rs в улье, я не мог найти способ сделать это

, помогите пожалуйста

1 Ответ

5 голосов
/ 18 ноября 2011

Некоторые опции:

1) Это даст вам максимальное значение y для каждого значения x

select x, max(y) from table1 group by x

Точно так же вы можете использовать avg () или min ()

2) ИЛИ вы можете собрать все значения y в списке:

select x, collect_set(y) from table1 group by x

Это даст вам:

x|y
1|2,3,4
2|2
3|1,2
...