Группировать строки по значениям столбца - PullRequest
0 голосов
/ 05 февраля 2020

Мне интересно в Hive, как распределить строки в N = 5 групп как можно более равномерно (связи должны go в одну группу, в то время как все группы должны иметь примерно одинаковый размер) на основе значения столбца, скажем, A Например, верхним 20% значения в столбце A будет назначено 1, 20% -40% значения в столбце A будет присвоено 2, et c ...

Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...