Я использую org.apache.hadoop.fs
, чтобы проверить, пуст ли каталог в HDFS или нет.Я посмотрел API-интерфейс FileSystem, но не смог найти ничего похожего на него.В основном я хочу проверить, является ли каталог пустым или сколько файлов существует в нем.
Мне удалось найти метод "существует", но это только говорит о том, существует ли путь.
val hdfs = FileSystem.get(spark.sparkContext.hadoopConfiguration)
val containsFile = fs.exists(new Path(dataPath))