У меня есть столбец с именем target_col_a
в моем фрейме данных со значением Timestamp, которое было преобразовано в String, например 2020-05-27 08:00:00
.
Я затем partitionBy
этот столбец, как показано ниже.
target_dataset \
.write.mode('overwrite') \
.format('parquet') \
.partitionBy('target_col_a') \
.save('s3://my-bucket/my-path')
Однако мой путь s3 выглядит как s3://my-bucket/my-path/target_col_a=2020-05-27 08%3A00%3A00/part-0-file1.snappy.parquet
Есть ли способ вывести раздел без %3A
и сохранить :
?
Примечание: когда я используйте Glue native DynamicFrame
для записи на S3 или Redshift UNLOAD
на S3, разделение происходит по желанию (без %3A
и с :
), например
glueContext.write_dynamic_frame.from_options(
frame = target_dataset,
connection_type = "s3",
connection_options = {
"path": "s3://my-bucket/my-path/",
"partitionKeys": ["target_col_a"]},
format = "parquet",
transformation_ctx = "datasink2"
)