Я хочу использовать aws datapipeline для планирования заданий emr.Я застрял на шаге, когда каждый раз, когда активируется новая линия данных, мне приходится копировать код с git на сервер, устанавливать pip-модули и запускать несколько заданий один за другим.Я проверил сеть и не нашел ни одного учебника или примера, подтверждающих это.
Могут ли некоторые объяснить, как мне поступить с этим.Заранее спасибо.