Я новичок в Spark Framework и мне нужен совет.
У меня такая структура папок.
reports
- 20180101
- 20180102
- 20180103
- GHWEI.csv
- DSFSD.csv
- GHWEI.csv
Отчеты (CSV-файлы) хранятся каждый день отдельно. Например, папка 20180103
собирает все отчеты третьего января 2018 года.
Перед чтением CSV-файлов мне необходимо проверить наличие пути. Как это сделать?
val reports = spark.read.option("delimiter", "|")
.csv("/reports/{20180101,20180102,20180103,}/*GHWEI*")
.orderBy("CREATE_DATE")
Прямо сейчас, если нет папки с именем 20180101
, 20180102
, 20180103
Ошибка Spark Raise, которая говорит, что такого пути нет. Код работает, только если одна из этих папок доступна.
Второй вопрос: как проверить, является ли значение отчета пустым или нет после прочтения?