Я получаю значения даты из файла данных pyspark в формате "mm.dd.yy". Я хотел бы преобразовать его в формат "mm.dd.yyyy".
Я пытался написать UDF, но функция даты и времени выдает ошибку.
from pyspark.sql.types import StringType
from pyspark.sql.functions import udf
import datetime
def change_date(date_string):
dateConv = datetime.datetime.strptime(date_string,'%d.%m.%y')
dt_str = datetime.datetime.strftime(dateConv,'%d.%m.%Y')
return dt_str
date_udf = udf(lambda date: change_date(date), StringType())
display(filterEmplyValues.withColumn("date", date_udf(col("date"))))
Я получаю сообщение об ошибке: `SparkException: задание прервано из-за сбоя этапа: сбой задачи 23 на этапе 302.0 4 раза, последний сбой: сбой задачи 23.3 на этапе 302.0 (TID 18078, 10.139.64.15, исполнитель 71): org. apache .spark.api. python .PythonException: Traceback (последний вызов был последним): файл "/databricks/spark/python/pyspark/worker.py", строка 480 , в основном процессе ()
ValueError: данные времени '00 .00.00 'не соответствуют формату'% d.% m.% y '`
Спасибо за помощь.