Как удалить файлы из облачного хранилища после завершения задания потока данных - PullRequest
0 голосов
/ 07 сентября 2018

В GCP у меня есть задание потока данных, которое выполняет копирование файлов из облачного хранилища в большой запрос. Я хотел бы удалить эти файлы, как только они успешно вставлены в большой запрос. Может ли кто-нибудь дать подсказки о том, как этого добиться, а также о том, как запустить другую работу после успешного выполнения предыдущей?

1 Ответ

0 голосов
/ 07 сентября 2018

Для этих типов сценариев обычно рекомендуется использовать инструмент для планирования и согласования рабочей нагрузки в вашей архитектуре. Google Cloud предоставляет Cloud Composer , управляемую версию Airflow , для решения именно этого варианта использования. Можно запланировать DAG (ориентированный ациклический граф) в Composer для запуска задания Dataflow, а затем, в случае успешного выполнения задания, выполнить дополнительные задачи для очистки файла или запустить следующий процесс.

Пример DAG

Example DAG

Для начала я рекомендую проверить документацию Cloud Composer , а также Примеры Cloud Composer , которые похожи на ваш вариант использования.

Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...