Я пытаюсь подключиться к местоположению hdfs из записной книжки базы данных, чтобы получить сведения о файле.
ниже приведен код, который я пытался получить таким же
%fs ls dbfs:/mnt/<mount>/dev/data/audit/
И я получил результат с размером, равным 0. И только подробности аудита папки, а не какой-либо из ее подпапок.
В папке аудита есть еще 5 подпапок с файлами внутри. Я хочу получить количество файлов в каждой подпапке и общий размер этих 5 подпапок.
Я пробовал ниже dbutils в scala, но у него нет никакой функции, чтобы получить количество файлов или размер файла.
- Есть ли способ получить размер папок и подпапок в hdfs из записной книжки databricks?
- Есть ли способ получить количество файлов в папки и подпапки в hdfs из блокнота данных?