Это кажется хорошим,
unlist(strsplit(mystring, split = ":", fixed=TRUE))[c(TRUE, FALSE,FALSE)]
(Сделано с помощью здесь )
Альтернатива может быть,
sapply(strsplit(mystring, split=':', fixed=TRUE), `[`, 1)
Используя некоторые тесты и недавние комментарии Ronak, которые исправили = TRUE, делают методы намного быстрее, мы видим, что метод four (метод выше) самый быстрый,
mystring <- c("01/09/2019 9:51:03", "01/09/2019 9:51:39", "01/09/2019 9:57:04",
"01/09/2019 10:01:41", "01/09/2019 10:06:06", "01/09/2019 10:09:36",
"01/09/2019 10:11:55", "01/09/2019 10:21:15", "01/09/2019 10:21:39",
"01/09/2019 10:52:20")
microbenchmark(one = sapply(strsplit(mystring, split=':', fixed=TRUE), `[`, 1),
two = unlist(lapply(mystring,function(x) strsplit(x,":", fixed=TRUE)[[1]][1])),
three = strptime(mystring, "%m/%d/%Y %H"),
four = unlist(strsplit(mystring, split = ":", fixed=TRUE))[c(TRUE, FALSE,FALSE)],
five = format(as.POSIXct(mystring, format = "%d/%m/%Y %H:%M:%OS"), "%d/%m/%Y %H"),
six = gsub("(.*?):.*", "\\1", mystring),
seven = str_extract(mystring, ".+(?=:.+:)"),
times = 100000)
Unit: microseconds
expr min lq mean median uq max neval
one 42.792 49.471 85.63742 52.572 57.1310 669280.96 1e+05
two 64.637 70.618 114.16364 73.252 77.6840 582466.94 1e+05
three 129.456 134.771 156.82308 136.188 139.2030 339715.94 1e+05
four 12.860 15.641 22.75699 17.254 18.5440 305703.52 1e+05
five 482.888 505.647 633.15388 512.880 552.1155 551274.28 1e+05
six 37.889 43.121 52.79030 45.567 49.1880 32954.59 1e+05
seven 53.432 59.051 88.05015 62.326 69.9320 1180361.17 1e+05