Я пытаюсь отформатировать свой столбец отметки времени, чтобы включить миллисекунды без успеха. Как мне отформатировать мое время, чтобы оно выглядело так - 2019-01-04 11:09:21.152
?
Я посмотрел документацию и следовал за SimpleDataTimeFormat, который, по словам документации pyspark, используется функцией to_timestamp
.
Это мой фрейм данных.
+--------------------------+
|updated_date |
+--------------------------+
|2019-01-04 11:09:21.152815|
+--------------------------+
Я использую миллисекундный формат без какого-либо успеха, как показано ниже
>>> df.select('updated_date').withColumn("updated_date_col2",
to_timestamp("updated_date", "YYYY-MM-dd HH:mm:ss:SSS")).show(1,False)
+--------------------------+-------------------+
|updated_date |updated_date_col2 |
+--------------------------+-------------------+
|2019-01-04 11:09:21.152815|2019-01-04 11:09:21|
+--------------------------+-------------------+
Я ожидаю, что updated_date_col2
будет отформатирован как 2019-01-04 11:09:21.152