Я пытаюсь иметь дело с переменной даты и времени (dttm) в кадре данных искры.Я использую sparklyr и dplyr.Вот моя проблема ...
Каждая строка рассматриваемого столбца имеет следующий формат:
Я хочу разделить этот столбец даты и времени (dttm) на два столбца:
- первый с датой: 2018-06-11 (гггг-мм-дд)
- второй со временем: 22:06:45 (чч: мм: сс)
Итак, во-первых, я использовал regexp_replace и mutate для создания столбца времени:
spark_df %>% mutate(time = regexp_replace(date_and_time, "^[^_]* ", ""))
Вот что я получаю в моем новом столбце «время»:
Итак, код почти работает,единственная проблема заключается в том, что две первые цифры конвертируются в 00.