Извлечение всех имен файлов csv из каталога HDFS с использованием spark / scala - PullRequest
0 голосов
/ 21 апреля 2020

Может кто-нибудь подсказать, как мне взять только файл .csv из моей директории HDFS, используя scala Я пытаюсь получить все имена файлов CSV из моего местоположения hdfs и пишу ниже код.

    var Fsys1 = FileSystem.get(sparksession.sparkContext.hadoopConfiguration)
    var FileNames = Fsys1 .listStatus(new  Path("hdfspath").filter(_.isFile).map(_.getPath.getName).toList

он дает мне все имена файлов, но я хочу получить только файлы .csv.

1 Ответ

0 голосов
/ 21 апреля 2020

Как @ pasha701 упоминается в комментариях. Вы можете фильтровать файлы, заканчивающиеся на ".csv"

.filter (_. ToLowerCase.endsWith (". Csv"))

Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...