Это не совсем ответ, лучше совет / рекомендация, если вы можете контролировать синтаксис пути, попробуйте сохранить ваши пути с разделами даты:
hdfs://dcoshdfs/encrypt_data/gmap_info/date=20190519
hdfs://dcoshdfs/encrypt_data/gmap_info/date=20190418
.
.
.
hdfs://dcoshdfs/encrypt_data/gmap_info/date20160101
Чем вы можете просто извлечь то, что вы хотите, используя искру:
val data = sc.textFile("hdfs://dcoshdfs/encrypt_data/gmap_info")`.where('date >= 20190204L && 'date <= 20190213L)
Это наиболее оптимизированный подход, поскольку искровая загрузка именно тех данных, которые ему нужны, не использует обнаружение разделов, а значит, он намного более читабелен.