Мы используем Airflow для планирования наших заданий в EMR, и в настоящее время мы хотим использовать apache Livy для отправки заданий Spark через Airflow. Мне нужно более подробное руководство ниже: Какой оператор Airflow-Livy мы должны использовать для python 3+ pyspark и scala рабочих мест. Я видел ниже: https://github.com/rssanders3/airflow-spark-operator-plugin и https://github.com/panovvv/airflow-livy-operators
Хочет узнать больше о стабильном операторе AirflowLivy, который кто-либо использует в производстве, вероятно, в стеке AWS.
Также Пошаговое руководство по установке для интеграции.