Я оптимизирую запрос в Bigquery, который показывает неповторяющиеся данные, в настоящее время это так, и он работает.
select * from (select
ROW_NUMBER() OVER (PARTITION BY id) as num,
id,
created_at,
operator_id,
description
from NAME_TABLE
where created_at >='2018-01-01') where num=1
Я хотел спросите, возможно ли сделать GROUP BY со всеми столбцами (простым способом это невозможно сделать, так как crated_at не позволяет сгруппировать его), и сохраните первые данные create_at, которые появляются для каждого идентификатора
PD: DISTINCT не работает, поскольку существует более 80 миллионов записей (они увеличиваются на 2 миллиона в день), и он возвращает повторные данные