Apache Airflow: инструмент планирования и мониторинга. Вам нужно написать свои ETL-скрипты (будь то на Python или Scala) и запустить их, используя Apache Airflow.
Такие инструменты, как Talend, Informatica предоставляют множество богатых пользовательских интерфейсов и встроенных функций, с помощью которых вы можете выполнять такие простые вещи, как сброс данных в очень сложные преобразования. Помимо этого планирования, оркестровка и т. Д. Может быть завершена с использованием собственной функции планирования.
Если вы пытаетесь создать хранилище данных корпоративного класса, имеющее большую сложность, я бы предложил воспользоваться инструментом ETL корпоративного класса. Это даст вам долгосрочную выгоду от Manageability, Support, Debugging и т. Д.