В настоящее время мы используем версию Airflow, установленную нами в Kubernetes, но идея состоит в том, чтобы перейти на Cloud Composer.Мы используем Airflow для запуска заданий потока данных с использованием настроенной версии DataFlowJavaOperator (с использованием плагина), потому что нам нужно запустить приложение java, которое не содержится в jar-файле.Таким образом, мы в основном запускаем скрипт bash, который запускает команду:
java -cp jar_folder/* MainClass
Все зависимости jar хранятся на общем диске между всеми работниками, но эта функция отсутствует в Composer, в котором мы вынужденыиспользовать облачное хранилище для обмена двоичными файлами заданий.Проблема в том, что запуск программы java из каталога, указывающего на GCS, с использованием gcsfuse очень медленный.
Есть ли у вас какие-либо предложения по реализации такого сценария в Cloud Composer?
Спасибо