Автоматизируйте загрузку файлов, хранящихся локально, в облачное хранилище с помощью gsutil - PullRequest
0 голосов
/ 09 апреля 2019

Я новичок в GCP, я пытаюсь создать поток ETL, который будет загружать данные из файлов в BigQuery. Мне кажется, что лучшим решением было бы использовать gsutil. Шаги, которые я вижу сегодня:

  1. (готово) Загрузка ZIP-файла с сервера SFTP на виртуальную машину
  2. (готово) Распаковка файла
  3. Загрузка файлов с виртуальной машины в облачное хранилище
  4. (готово) Автоматическая загрузка файлов из облачного хранилища в BigQuery

Шаги 1 и 2 будут выполняться в соответствии с расписанием, но я бы хотел, чтобы шаг 3 был ориентирован на события. Поэтому, когда файлы копируются в определенную папку, gsutil отправит их в указанное место в облачном хранилище. Есть идеи, как это можно сделать?

1 Ответ

1 голос
/ 09 апреля 2019

Предполагая, что вы работаете на виртуальной машине Linux, вы можете проверить inotifywait, , как указано в этом вопросе - вы можете запустить его как фоновый процесс, чтобы попробовать его, напримерbash /path/to/my/inotify/script.sh &, а затем установите его в качестве демона, как только вы протестируете его и получите что-то работающее по своему вкусу.

Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...