Google Cloud Composer - Создать среду - с несколькими экземплярами вычислительного движка - Это дорого - PullRequest
0 голосов
/ 21 марта 2019

Я новичок в Google Cloud Composer и следую инструкции QuickStart: Создать среду, Загрузить нагрузку, Проверить поток воздуха и Удалить среду.

Но в (реальном) случае производственного использования после того, как мы закончим загрузку файлов dag и запустим их в среде. Должны ли мы удалить среду Google Cloud Composer? Потому что в этом композиторе может быть несколько экземпляров вычислений, которые сейчас ничего не делают. Это дорого.

Но если я удалю среду, то потеряю доступ к ее веб-порталу airflow и не смогу проверить журналы обработки моей обработки в удаленной среде.

Так что мне делать? В реальных производственных случаях следует ли удалять или не удалять среду после завершения обработки?

1 Ответ

1 голос
/ 22 марта 2019

Apache Airflow (и, следовательно, Cloud Composer) предназначен для организации рабочих процессов, а не для пакетных заданий ETL, которые требуют только временных вычислительных ресурсов.Аналогично тому, как вы не отключите сервер только потому, что запланированная задача cron не выполняется, среды Composer предназначены для длительных вычислительных ресурсов, которые всегда подключены к сети, так что вы можете планировать повторяющиеся рабочие процессы при необходимости (будь тов секунду, ежедневно и т. д.)

В реальном производственном случае среду Composer всегда следует оставлять включенной, иначе группы DAG не будут запланированы, когда она не работает.Если у вас есть среда разработки и вы хотите сэкономить, вы можете изменить размер присоединенного кластера GKE среды Composer на 0 узлов, чтобы вам не выставляли счета за них.Точно так же, если вы считаете, что у вас недостаточно групп обеспечения доступности баз данных, чтобы оправдать затраты, рассмотрите возможность использования машин меньшего размера.

...