Я новичок в AWS Glue и PySpark.Ниже приведен пример кода
glue_context.create_dynamic_frame.from_catalog(
database = "my_S3_data_set",
table_name = "catalog_data_table",
push_down_predicate = my_partition_predicate)
в руководстве Управление разделами для вывода ETL в AWS Glue .
Предположим, что SQL-запрос для фильтрации фрейма данных выглядит следующим образом
select * from catalog_data_table
where timestamp >= '2018-1-1'
Как выполнить предварительную фильтрацию на AWS Glue?