Это невозможно, Spark принимает только формат даты yyyy-MM-dd
.
Если вам нужно MMddyyyy
это поле даты формата, сохраните его как String
* * * * * * * * * * * * * * * * Тип: * * * * * * * * * * * * * * * * * * * * * * * * * *}}}
1013 * Пример: *1011* *1012* Пример:
df.withColumn("Col3",$"col2".cast("date")) //casting col2 as date datatype Results null
.withColumn("col4",to_date($"col2","MMddyyyy").cast("date")) //changing format and casting as date type
.show(false)
* * * * * * * * * * * * * * * * * * * * *1017* Результат: *1019*
+----+--------+----+----------+
|Col1| Col2|Col3| col4|
+----+--------+----+----------+
| 1|01132019|null|2019-01-13|
| 2|01142019|null|2019-01-14|
+----+--------+----+----------+
Schema:
df.withColumn("Col3",$"col2".cast("date"))
.withColumn("col4",to_date($"col2","MMddyyyy").cast("date"))
.printSchema
Результат:
root
|-- Col1: string (nullable = true)
|-- Col2: string (nullable = true)
|-- Col3: date (nullable = true)
|-- col4: date (nullable = true)