Это мое требование: у меня есть работа гусеничной машины и pyspark в AWS Glue. Я должен настроить рабочий процесс, используя пошаговую функцию.
Вопрос 1: Как я могу добавить Crawler в качестве первого состояния. Какие параметры мне нужно предоставить (Resource, Type et c). Вопрос 2: Как убедиться, что следующее состояние - задание Pyspark запускается только после успешного запуска искателя. Вопрос 3: Можно ли запланировать запуск конечного автомата функции шага в определенное время?