Я пытаюсь получить последний файл из s3 за последние 10 дней, когда на входе нет файла.Проблема в том, что путь содержит дату.
Мой путь такой:
val path = "s3://bucket-info/folder1/folder2"
val date = "2019/04/12" ## YYYY/MM/DD
Я делаю это =
val update_path = path+"/" +date //this will become s3://bucket-info/folder1/folder2/2019/04/12
def fileExist(path: String, sc: SparkContext): Boolean = FileSystem.get(getS3OrFileUri(path),
sc.hadoopConfiguration).exists(new Path(path + "/_SUCCESS"))
if (fileExist(update_path, sc)) {
//read and process the file
} else {
log("File not exist")
// I need to get the latest file in the last five days and use. So that I can check "s3://bucket-info/folder1/folder2/2019/04/11" , s3://bucket-info/folder1/folder2/2019/04/10 and others. If no latest file in last 5 days. throw error. s
}
Но моя проблема в том, как мне проверить, когда наступает конецмесяц?Я могу сделать это для цикла, но есть ли оптимизированный и элегантный способ сделать это в искре?