Когда я экспортирую данные из MySQL в BigQuery, некоторые данные дублируются. Чтобы исправить это, я подумал о создании представлений этих таблиц с использованием номера строки. Запрос для этого показан ниже. Проблема в том, что многие таблицы в моем наборе данных дублируются, и, возможно, когда я добавляю новые таблицы и экспортирую их в большой запрос, они будут иметь дублированные данные, и я не хочу создавать этот тип запроса каждый раз, когда я добавляю новая таблица в моем наборе данных (я хочу, чтобы в момент экспорта новой таблицы было создано представление этой таблицы). Возможно ли это сделать в цикле в запросе (например, «для каждой таблицы в моем наборе данных сделать это»)? Возможно ли это сделать в сценарии оболочки (при экспорте таблицы в большой запрос создайте представление для этой таблицы)? В последнем случае это возможно сделать в python?
SELECT
* EXCEPT (ROW_NUMBER)
FROM
(
SELECT
*, ROW_NUMBER() OVER (PARTITION BY id order by updated_at desc) ROW_NUMBER
FROM dataset1.table1
)
WHERE ROW_NUMBER = 1