Может кто-нибудь сообщить мне, как фильтровать метку даты в файле
У меня есть следующие файлы в соответствующих папках в озере данных Azure:
adl://carlslake.azuredatalakestore.net/folderOne/filenr1_1166_2018-12-20%2006-05-52.csv
adl://carlslake.azuredatalakestore.net/folderTwo/filenr2_1168_2018-12-22%2006-07-31.csv
Я написал следующий скрипт, которыйбудет читать все файлы .csv в обеих папках, но я хочу только читать файлы .csv в соответствующих папках на основе текущей даты.
test1 = spark.read.csv("adl://carlslake.azuredatalakestore.net/folderOne/",inferSchema=True,header=True)
test2 = spark.read.csv("adl://carlslake.azuredatalakestore.net/folderTwo/",inferSchema=True,header=True)
Может кто-нибудь дать мне знать, как настроить вышеуказанные файлы для чтенияв папках на основе текущей даты, например, два файла .csv: 2018-12-20 и 2018-12-22
Я думал, что это могло быть написано что-то вроде
test1 = spark.read.csv("adl://carlslake.azuredatalakestore.net/folderOne/", select(current_date)inferSchema=True,header=True)
Ноэто не сработало