В процессе ETL, которым мы управляем, мы получаем иногда поврежденные файлы.Мы попробовали эту конфигурацию Spark, и, похоже, она работает (задание Spark не завершается сбоем, поскольку поврежденные файлы отбрасываются):
spark.sqlContext.setConf("spark.sql.files.ignoreCorruptFiles", "true")
Но я не знаю, есть ли возможность узнать, какие файлы были проигнорированы,В любом случае, чтобы получить эти имена файлов?
Заранее спасибо