Я использую Spark для записи двух разных фреймов данных в один и тот же раздел, но я хочу, чтобы они были разделены папками в конце раздела. т.е. первый фрейм данных будет записывать в yyyy/mm/dd/
, а второй - в yyyy/mm/dd/rejected/
В настоящее время я могу записать первый фрейм данных в yyyy/mm/dd/
, а второй фрейм данных в rejected/yyyy/mm/dd
, используя следующий код:
first_df.repartition('year', 'month', 'day').write \
.partitionBy('year', 'month', 'day') \
.mode("append") \
.csv(f"{output_path}/")
second_df.repartition('year', 'month', 'day').write \
.partitionBy('year', 'month', 'day') \
.mode("append") \
.csv(f"{output_path}/rejected")
Любые предложения приветствуются