Мой вариант использования довольно прост. Поставщик данных помещает файлы CSV в Google Storage каждый час. Один раз в день задание на перенос берет эти файлы и отправляет их в таблицу BigQuery. Проблема в том, что мне нужно переименовать эти поля.
Первое, что пришло мне в голову, - это просто использовать запланированный запрос, например
SELECT bad_field AS good_field (...) FROM raw_table
, и запланировать этот запрос, чтобы добавить результаты вхороший стол. Я не уверен, что это очень чистое решение, потому что я только начинаю с BigQuery.
Я также читал о DataFlow, но у меня нет опыта работы с этим сервисом.
Кто-нибудьбыл такой сценарий? Как ты с этим справился?