AWS Glue выглядит многообещающе, но у меня есть проблема с временем цикла разработки.Если я редактирую скрипты PySpark через консоль AWS, выполнение нескольких минут занимает даже минимальный набор тестовых данных.Это затрудняет быструю итерацию, если мне нужно подождать 3-5 минут, чтобы посмотреть, вызвал ли я правильный метод для glueContext
или понял определенное поведение DynamicFrame
.
Какие методы позволили бы мнеитерировать быстрее?
Полагаю, я мог бы разработать код Spark локально и развернуть его в Glue в качестве среды выполнения.Но если мне нужно протестировать код с расширениями, специфичными для Glue, я застрял.