Импала CREATE TABLE от SELECT отбрасывает / пропускает строки - PullRequest
0 голосов
/ 11 февраля 2020

Рассмотрим следующий запрос в Impala:

SELECT count(*) FROM (
SELECT
    .
    .
    .
    sum(revenue) as revenue,
    date_time_hours,
    date_time_day,
    date_time_month,
    date_time_year
FROM customer_records
WHERE
    date_time_day=day(DAYS_SUB(now(), 1)) AND
    date_time_month=month(DAYS_SUB(now(), 1)) AND
    date_time_year=year(DAYS_SUB(now(), 1)) AND
    cust_id='25'
GROUP BY    
    .
    .
    .
    date_time_hours,
    date_time_day,
    date_time_month,
    date_time_year
) A1

Это даст мне счет в 3 458 017 строк.

Однако, если я сделаю следующее:

CREATE TABLE C1 AS
SELECT
    .
    .
    .
    sum(revenue) as revenue,
    date_time_hours,
    date_time_day,
    date_time_month,
    date_time_year
FROM customer_records
WHERE
    date_time_day=day(DAYS_SUB(now(), 1)) AND
    date_time_month=month(DAYS_SUB(now(), 1)) AND
    date_time_year=year(DAYS_SUB(now(), 1)) AND
    cust_id='25'
GROUP BY    
    .
    .
    .
    date_time_hours,
    date_time_day,
    date_time_month,
    date_time_year

Это дает мне следующий вывод:

Inserted 817391 row(s)

Почему я пропускаю строки?

Я выполняю эти запросы на панели инструментов Hue.

Возможно, связано: Различное количество строк при создании таблицы или представления в Impala

...