Начиная с Spark 2.3.0, эта опция используется при перезаписи таблицы.Чтобы перезаписать его, вам нужно установить новую настройку spark.sql.sources.partitionOverwriteMode
на dynamic
, набор данных должен быть разбит на части, а режим записи overwrite
.Пример:
spark.conf.set(
"spark.sql.sources.partitionOverwriteMode", "dynamic"
)
data.write.mode("overwrite").insertInto("partitioned_table")
Я рекомендую сделать перераспределение на основе столбца вашего раздела перед записью, чтобы у вас не было 400 файлов в папке.
До Spark 2.3.0,Лучшим решением было бы запустить операторы SQL для удаления этих разделов, а затем записать их с помощью режима добавления.