Как можно избежать того, чтобы AWS Glue записывал пустые объекты в S3?
У меня есть задание на клей, которое записывает полученный динамический кадр в S3:
dynamic_frame = # result of Glue job processing
glue_context.write_dynamic_frame.from_options(
frame = dynamic_frame,
connection_type = 's3',
connection_options = {'path': 's3://some-bucket/some-path'},
format = 'json')
Однако, когда я проверяю содержимое сегмента в S3, я вижу не только данные, но и множество объектов, имеющих размер 0 B. Как я могу предотвратить это?
Я пытался использовать класс DropNullFields (см. Ниже), но это не помогло.
dynamic_frame = # result of Glue job processing
non_null_fields = DropNullFields.apply(dynamic_frame)
glue_context.write_dynamic_frame.from_options(
frame = non_null_fields,
connection_type = 's3',
connection_options = {'path': 's3://some-bucket/some-path'},
format = 'json')