Вы должны прочитать файл как CSV, а не текст.Я просто имитирую это, используя жестко закодированный df в Scala.Вы должны быть в состоянии преобразовать его в python с аналогичным синтаксисом.
val df = Seq((1,"01-01-2001"),(2,"01-02-2001"),(3,"01-03-2001")).toDF("a","b")
val df2 = df.withColumn("b",to_date('b,"dd-MM-yyy"))
df2.printSchema()
df2.show(false)
df2.select(col("a"), date_format('b,"MM/yyyy").as("dt1")).show(false)
Результаты:
root
|-- a: integer (nullable = false)
|-- b: date (nullable = true)
+---+----------+
|a |b |
+---+----------+
|1 |2001-01-01|
|2 |2001-02-01|
|3 |2001-03-01|
+---+----------+
+---+-------+
|a |dt1 |
+---+-------+
|1 |01/2001|
|2 |02/2001|
|3 |03/2001|
+---+-------+