У меня есть фрейм данных, в котором столбец даты / времени имеет строковый тип данных и выглядит примерно как "Tue Apr 21 01:16:19 2020"
. Как мне преобразовать это в столбец даты с форматом 2020/04/21
в pyspark. Я пробовал что-то вроде этого,
option1:
df = df.withColumn("event_time2",from_unixtime(unix_timestamp(col("Event_time"), 'MM/dd/yyy')))
option2:
df= df.withColumn("event_time2",unix_timestamp(col("Event_time"),'yyyy-MM-dd HH:mm:ss').cast("timestamp"))
, но оба возвращают null