Как передать переменные в путь spark.read.csv с помощью PySpark - PullRequest
0 голосов
/ 26 сентября 2019

Я использую PySpark для чтения каждый день CSV-файла, который называется что-то вроде AA_ "current_date", где, конечно, "current_date" меняется каждый день.

Проблема в том, что внутри пути spark.read.csv я хотел бы поместить переменную типа /AA_$current_date.csv, но сейчас я не совсем понимаю, как этого добиться.

Может кто-нибудьпомогите пожалуйста?

1 Ответ

2 голосов
/ 26 сентября 2019
>>> from datetime import date
>>> today = date.today().strftime("%d-%m-%Y")
>>> path = "AA_" + today + ".csv"
>>> base_path = "/home/user/"
>>> finalpath = base_path + path
>>> finalpath
'/home/user/AA_26-09-2019.csv'
>>> df1 = spark.read.format("csv").option("header","true").load(finalpath)
Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...