Я нахожу вопрос немного неясным с точки зрения перезаписи в заголовке, но добавляю его в текст. Я думаю, это зависит от толкования.
Кроме того, не уверен, что это таблица или просто файл, но, например, это работает нормально:
df.write.format("parquet").mode("append").save("/user/mapr/123/SO.parquet")
В этом случае вы можете добавлять любые данные несколько раз в каталог, а не в зарегистрированную таблицу Hive. и DF Writer делает все это.
Если перезаписать, то этого тоже достаточно, но вам также необходимо предоставить исходные данные, если вы не хотите их потерять:
df.write.format("parquet").mode("overwrite").save("/user/mapr/123/SO.parquet")
Вполне возможно, что то, что вы хотите, невозможно, то есть добавляется и новое. В этом случае вам потребуется собственный анализатор различий и несколько строк кода.