Я пытаюсь записать DF в один файл паркета на основе некоторого ключа (раздела по имени) для S3.Мое требование - добавлять данные в один и тот же файл паркета для каждого прогона.
Это код, который я использовал, но этот код создавал папки для каждого имени в этой папке для каждого прогона, создавая новые файлы паркета.Однако мое требование - записать в один файл.
df.coalesce(1).write.partitionBy("name").format("parquet").mode(SaveMode.Append).option("fileType", "parquet").save("s3n://ialert-data/store-streaming-data/")