Создать таблицу не имеет ожидаемое количество строк - PullRequest
0 голосов
/ 22 апреля 2020

Мы имеем дело с данными журнала машин, которые находятся в Presto. В таблице запросов Teradata создается представление, которое будет запрашивать предварительное состояние и иметь результат в виде блоков данных. Для некоторых других внутренних случаев использования мы пытаемся создать таблицу в Teradata, но сталкиваемся с трудностями при этом.

Когда мы пытаемся создать таблицу в Teradata для определенной даты, которая имеет только 2610117,459,037,913088 записей 14K нечетных записей вставляются в целевую таблицу. Ниже приведен запрос для того же. xyz.view - это представление, созданное в сетке запросов TD, которое в итоге извлекает данные из presto.

CREATE TABLE abc.test_table AS
    ( SELECT * FROM xyz.view WHERE event_date = '2020-01-29' )
WITH DATA PRIMARY INDEX (MATERIAL_ID, SERIAL_ID);

Но когда мы создаем таблицу с образцами данных (например, образец 10000000), мы получаем точное количество записей в таблица, созданная как показано ниже:

    CREATE TABLE abc.test_table AS
    ( SELECT * FROM xyz.view WHERE event_date = '2020-01-29' sample 10000000)
WITH DATA PRIMARY INDEX (MATERIAL_ID, SERIAL_ID);

Но снова создание с выборкой из 1 миллиарда записей дает нам только 208 миллионов нечетных записей в нашей целевой таблице. Может ли кто-нибудь помочь здесь, чтобы узнать, почему это происходит и возможно ли создать таблицу с 2610117,459,037,913088 записями.

Мы используем TD 16.

...