Для задания, выполняемого на данных из корзины S3 в формате паркета, существует два способа:
Создать искатель для создания таблицы схемы, используйте glueContext.create_dynamic_frame.from_catalog(dbname, tablename)
, чтобысформировать динамический фрейм внутри задания Glue.
Чтение непосредственно из S3 с использованием glueContext.create_dynamic_frame.from_options("s3", {"paths": [full_s3_path] }, format="parquet")
Поскольку моя схема данных НЕ изменится во времениЕсть ли какие-либо преимущества (с точки зрения производительности или еще) для использования Crawler?Зачем мне в этом случае гусеничный ход?