Развертывание кодовой базы воздушного потока - PullRequest
0 голосов
/ 31 августа 2018

Мы находимся в процессе оптимизации наших конвейеров сборки / развертывания для кодовой базы воздушного потока.

Есть ли у кого-нибудь опыт сборки и развертывания конвейеров с использованием инструментов CI / CD для воздушного потока apache?

Как, вы развертываете свою кодовую базу воздушного потока, включая группы DAG / плагины / операторы, в различных средах, таких как тестирование, подготовка, производство и т. Д.

Как вы управляете конфигурацией airflow.cfg для каждой среды?

Где вы управляете своими конфигами для каждой среды.

1 Ответ

0 голосов
/ 31 августа 2018

Мы встраиваем весь наш код в образ Docker (DAG, плагины, разные пакеты Python, разные файлы airflow.cfg и т. Д.), Который передается в наш кластер Kubernetes. Один и тот же образ работает везде, гарантируя, что зависимости остаются заблокированными, и каждый Airflow настроен наилучшим образом для его случая использования (мы запускаем несколько экземпляров Airflow в нашем кластере Kubernetes).

Что касается CI / CD, так как наше развертывание в значительной степени является всего лишь попыткой докера, мы использовали CircleCI без каких-либо проблем.

Для управления средами мы постараемся сохранить одинаковые имена для всех потоков Airflow (например, redshift_conn), но с разными учетными данными (dev Redshift vs prod Redshift). Я думаю, что для этого должны быть более элегантные решения, но пока это работает для нас.

...