Как рассчитать условие найти разницу между двумя DateTime в минутах в R - PullRequest
0 голосов
/ 06 апреля 2020

Я моделирую данные, а DateTime - это тип даты из базы данных. Я хочу вычислить разницу в минутах между двумя DateTime и найти среднее время до целого или десятичного числа из группы.
Он рассчитывается только с подтверждением.

может быть, похоже на этот кадр данных вывода.

и это мой график ожидания. Оранжевый цвет - это deny grom group1

enter image description here

Как я могу это сделать? Спасибо, что пришли.

1 Ответ

0 голосов
/ 06 апреля 2020

Вы также можете выполнить sh это с использованием пакетов dplyr и ggplot2. Кроме того, вы можете использовать пакет lubridate, если ваши даты являются строками.

Чтобы получить различия и средние значения :

library(dplyr)
#load if you need to convert strings to dates
library(lubridate)

#df as in example, check 'Data' below
df_new <- df %>%
#counting differences in minutes
  mutate(difference = difftime(ymd_hms(date1), ymd_hms(date2), unit = "mins")) %>%
#grouping dates by 'abc' group
  group_by(group1) %>%
#counting average difference for every 'abc' group in minutes
  mutate(average = mean(difference))

Для построения участка:

library(ggplot2)

#passing summarized data to ggplot to create a plot and choosing aesthetics / dimensions to be ploted
ggplot(df_new, aes(y = avg_diff, x = group1, fill = group2)) +
#choosing type of plot
  geom_col() +
#flipping x and y axis
  coord_flip() +
#choosing colors
  scale_fill_manual(values = c("green", "orange"))

Result plot

Данные:

df <- data.frame(date1 = c("2020-04-05 11:51:51",
                           "2020-04-06 13:55:16",
                           "2020-04-06 14:26:56",
                           "2020-04-06 14:35:05",
                           "2020-04-06 14:36:00",
                           "2020-04-06 14:36:31",
                           "2020-04-06 14:36:31",
                           "2020-04-04 19:00:38",
                           "2020-04-05 21:22:23"),
                 date2 = c("2020-04-05 10:10:23",
                           "2020-04-06 11:41:20",
                           "2020-04-06 14:25:58",
                           "2020-04-06 14:26:03",
                           "2020-04-06 14:32:02",
                           "2020-04-06 14:33:35",
                           "2020-04-06 14:33:35",
                           "2020-04-04 18:30:29",
                           "2020-04-05 21:21:46"),
                 group1 = c("a", "b", "a", "a", "a", "b", "b", "c", "c"),
                 group2 = c("accept", "accept", "accept", "denny", "denny", "accept", "accept", "denny", "denny"),
                 stringsAsFactors = F)
...