Рассмотрим следующий запрос в Impala:
SELECT count(*) FROM (
SELECT
.
.
.
sum(revenue) as revenue,
date_time_hours,
date_time_day,
date_time_month,
date_time_year
FROM customer_records
WHERE
date_time_day=day(DAYS_SUB(now(), 1)) AND
date_time_month=month(DAYS_SUB(now(), 1)) AND
date_time_year=year(DAYS_SUB(now(), 1)) AND
cust_id='25'
GROUP BY
.
.
.
date_time_hours,
date_time_day,
date_time_month,
date_time_year
) A1
Это даст мне счет в 3 458 017 строк.
Однако, если я сделаю следующее:
CREATE TABLE C1 AS
SELECT
.
.
.
sum(revenue) as revenue,
date_time_hours,
date_time_day,
date_time_month,
date_time_year
FROM customer_records
WHERE
date_time_day=day(DAYS_SUB(now(), 1)) AND
date_time_month=month(DAYS_SUB(now(), 1)) AND
date_time_year=year(DAYS_SUB(now(), 1)) AND
cust_id='25'
GROUP BY
.
.
.
date_time_hours,
date_time_day,
date_time_month,
date_time_year
Это дает мне следующий вывод:
Inserted 817391 row(s)
Почему я пропускаю строки?
Я выполняю эти запросы на панели инструментов Hue.
Возможно, связано: Различное количество строк при создании таблицы или представления в Impala