R: установить столбец данных как дата-время для создания интервалов - PullRequest
1 голос
/ 27 мая 2019

У меня есть фрейм данных с именем data, который содержит информацию о дате и времени в столбце в следующем формате: мм / дд / гггг чч: мм: сс am / pm

То, что я хочу, это создать значения периода времени пут: в течение 1 часа, в течение 2 часов и т. Д.

несколько строк моего фрейма данных:

        time                    timeperiod  refer x.x
1       05/07/2017 18:00:15         NA         1 23.97370
2       06/08/2017 06:21:12         NA         1 23.79394
3       06/08/2017 08:03:11         NA         1 23.79394
4       06/08/2017 08:12:47         NA         1 23.79394
5       07/07/2017 10:41:45         NA         1 23.54257
6      1/21/2017 8:10:20 AM         NA         1 21.06460
7      1/9/2013 10:01:32 PM         NA         2 23.99733
8      1/9/2013 10:01:32 PM         NA         2 23.99733
9      1/9/2013 10:01:32 PM         NA         2 21.06460
10     1/9/2013 10:01:32 PM         NA         2 21.06460

Я пытался: strftime (data $ time., format = "% m /% d /% y% H:% M:% S"% r), но я получаю следующую ошибку:

Ошибка в as.POSIXlt.character (as.character (x), ...): строка символов не в стандартном однозначном формате

1 Ответ

0 голосов
/ 27 мая 2019

Опция будет

i1 <- grepl("AM|PM", df1$time)
out <- as.POSIXct(rep(NA_real_, nrow(df1)), origin = "1970-01-01")
out[i1] <- as.POSIXct(df1$time[i1], format = "%m/%d/%Y %I:%M:%S %p")
out[!i1] <- as.POSIXct(df1$time[!i1], format = '%m/%d/%Y %H:%M:%S')
droplevels(cut(out, breaks = "1 hour"))
#[1] 2017-05-07 18:00:00 2017-06-08 06:00:00 2017-06-08 08:00:00 2017-06-08 08:00:00 2017-07-07 10:00:00 2017-01-21 08:00:00
#[7] 2013-01-09 22:00:00 2013-01-09 22:00:00 2013-01-09 22:00:00 2013-01-09 22:00:00
#Levels: 2013-01-09 22:00:00 2017-01-21 08:00:00 2017-05-07 18:00:00 2017-06-08 06:00:00 2017-06-08 08:00:00 2017-07-07 10:00:00

Или другой вариант parse_date из parsedate и floor_date

library(lubridate)
library(parsedate)
floor_date(parse_date(df1$time), "hour")
#[1] "2017-05-07 18:00:00 UTC" "2017-06-08 06:00:00 UTC" "2017-06-08 08:00:00 UTC" "2017-06-08 08:00:00 UTC" "2017-07-07 10:00:00 UTC"
#[6] "2017-01-21 08:00:00 UTC" "2013-01-09 22:00:00 UTC" "2013-01-09 22:00:00 UTC" "2013-01-09 22:00:00 UTC" "2013-01-09 22:00:00 UTC"

data

df1 <- structure(list(time = c("05/07/2017 18:00:15", "06/08/2017 06:21:12", 
"06/08/2017 08:03:11", "06/08/2017 08:12:47", "07/07/2017 10:41:45", 
"1/21/2017 8:10:20 AM", "1/9/2013 10:01:32 PM", "1/9/2013 10:01:32 PM", 
"1/9/2013 10:01:32 PM", "1/9/2013 10:01:32 PM"), timeperiod = c(NA, 
NA, NA, NA, NA, NA, NA, NA, NA, NA), refer = c(1L, 1L, 1L, 1L, 
1L, 1L, 2L, 2L, 2L, 2L), x.x = c(23.9737, 23.79394, 23.79394, 
23.79394, 23.54257, 21.0646, 23.99733, 23.99733, 21.0646, 21.0646
)), class = "data.frame", row.names = c("1", "2", "3", "4", "5", 
"6", "7", "8", "9", "10"))
...