Непоследовательные результаты подсчета Apache HIVE - PullRequest
0 голосов
/ 25 июня 2019

У нас последняя версия HDP от Hortonworks с версией Hive (3.1.0)

У меня проблема при попытке подсчитать количество строк при заданном условии. Счетчик (*) возвращает ложное значение при параллельном выполнении с простым выбором при тех же условиях

Пример:

select *
from mydata
where product = "157536" and
      date = "2019-03-05";

=> дает 34 строки

select count(*)
from mydata
where product = "157536" and
      date = "2019-03-05";

=> дает счет 9

После поиска в сети: я попробовал

АНАЛИЗ ТАБЛИЦЫ mydata СТАТИСТИКА КОМПЬЮТЕРА; (до подсчета, но безрезультатно)

также попытался восстановить таблицу

также пытался поиграть с этими параметрами: hive.stats.autogather и hive.compute.query.using.stats => но ничего

Дополнительная информация: Hive работает с Tez

...