В spark есть конфигурация spark.sql.parquet.output.committer.class.Требуется тот тип коммиттера, который мы хотели использовать при сохранении файла.
Я обнаружил, что эти 2 коммиттера довольно широко используются:
com.netflix.bdp.s3.S3PartitionedOutputCommitter
org.apache.spark.sql.parquet.DirectParquetOutputCommitter
Какой из них лучше, а какие плюсы иминусы использования каждого?