Я новичок в GCP, я пытаюсь создать поток ETL, который будет загружать данные из файлов в BigQuery. Мне кажется, что лучшим решением было бы использовать gsutil. Шаги, которые я вижу сегодня:
- (готово) Загрузка ZIP-файла с сервера SFTP на виртуальную машину
- (готово) Распаковка файла
- Загрузка файлов с виртуальной машины в облачное хранилище
- (готово) Автоматическая загрузка файлов из облачного хранилища в BigQuery
Шаги 1 и 2 будут выполняться в соответствии с расписанием, но я бы хотел, чтобы шаг 3 был ориентирован на события. Поэтому, когда файлы копируются в определенную папку, gsutil отправит их в указанное место в облачном хранилище. Есть идеи, как это можно сделать?