У нас последняя версия HDP от Hortonworks с версией Hive (3.1.0)
У меня проблема при попытке подсчитать количество строк при заданном условии. Счетчик (*) возвращает ложное значение при параллельном выполнении с простым выбором при тех же условиях
Пример:
select *
from mydata
where product = "157536" and
date = "2019-03-05";
=> дает 34 строки
select count(*)
from mydata
where product = "157536" and
date = "2019-03-05";
=> дает счет 9
После поиска в сети: я попробовал
АНАЛИЗ ТАБЛИЦЫ mydata СТАТИСТИКА КОМПЬЮТЕРА; (до подсчета, но безрезультатно)
также попытался восстановить таблицу
также пытался поиграть с этими параметрами: hive.stats.autogather и hive.compute.query.using.stats => но ничего
Дополнительная информация: Hive работает с Tez