Улей подсчитывает различные UDAF - PullRequest
1 голос
/ 18 января 2020

Я столкнулся с запросом Hive, вычисляющим count distinct без группировки, который выполняется очень медленно. Поэтому мне было интересно, как эта функциональность реализована в Hive, есть ли UDAFCountDistinct для этого?

1 Ответ

0 голосов
/ 18 января 2020

Hive 1.2.0+ обеспечивает оптимизацию автоматического перезаписи для подсчета (различается) . Проверьте эту настройку:

hive.optimize.distinct.rewrite=true;
Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...