Я пытаюсь получить правильную дату из базы данных Hive. Когда я извлекаю дату, я получаю предыдущую дату с первоначальной даты.
скажем, data_date - 31 марта 2019 года, но я получу 30 марта 2019 года, когда потяну его в искру R. Это можно решить с помощью utc_timestamp (data_date, 'UTC').
Но это даст мне класс даты-времени (dttm), тогда как мне нужно, чтобы он был преобразован в класс даты. Я пытаюсь сделать с помощью to_date (data_date2), но он возвращает результат data_date. Я
> tbl %>% select(opened_dt,data_date) %>%
mutate(data_date1 = from_utc_timestamp(data_date, 'UTC'),
data_date2 = substr(data_date1,1,10),
dt3= to_date(data_date2))
# Source: spark<?> [?? x 5]
opened_dt data_date data_date1 data_date2 dt3
<date> <date> <dttm> <chr> <date>
1 2014-10-08 2019-04-29 2019-04-30 05:00:00 2019-04-30 2019-04-29
2 2017-08-07 2019-04-29 2019-04-30 05:00:00 2019-04-30 2019-04-29