Я хочу разделить столбец "_time", который содержит дату и время (как fieldtype = string)
даты внутри столбца "_time" выглядят так: 27-11-2017 08:20:33 Итак, я подумал, что это может сработать:
df.withColumn("col1", split(col("_time"), "\\-").getItem(0))
.withColumn("col2", split(col("_time"), "\\-").getItem(1))
.withColumn("col3", split(col("_time"), "\\-").getItem(2))
.withColumn("col4", split(col("_time"), "\\' '").getItem(3))
.show()
, но это приводит к:
-------------------+----+----+-------------+----+
_time|col1|col2| col3|col4|
-------------------+----+----+-------------+----+
27-11-2017 08:20:33| 27| 11|2017 08:20:33|null|
27-11-2017 08:20:35| 27| 11|2017 08:20:35|null|
27-11-2017 08:20:35| 27| 11|2017 08:20:35|null|
, так что, похоже, он ничего не делает с пробелом.Я пытался использовать это:
.withColumn("col4", split(col("_time"), "\\' '")
, но это также не работает.(дает тот же результат)
есть предложения?
С уважением