Question

Я пытаюсь заполнить пропущенные минуты из кадра данных, который имеет разные группы.Я хотел бы, чтобы пропущенные минуты были заполнены нулями.

Я пытался использовать это R - Заполнить пропущенные даты по группе , но не могу найти способ заполнить пропущенные минуты.

Datetime            | Group | Value |
2019-01-01 00:00:00 |  1    |  5    |
2019-01-01 00:00:00 |  2    |  4    |
2019-01-01 00:00:00 |  3    |  2    | 
2019-01-01 00:01:00 |  1    |  1    |
2019-01-01 00:02:00 |  1    |  2    | 
2019-01-01 00:02:00 |  2    |  2    |
2019-01-01 00:02:00 |  3    |  1    |
2019-01-01 00:03:00 |  1    |  1    |
2019-01-01 00:03:00 |  2    |  2    |
2019-01-01 00:04:00 |  1    |  1    |

Я бы хотел, чтобы финальный стол выглядел так -

Datetime            | Group | Value |
2019-01-01 00:00:00 |  1    |  5    |
2019-01-01 00:00:00 |  2    |  4    |
2019-01-01 00:00:00 |  3    |  2    | 
2019-01-01 00:01:00 |  1    |  1    |
2019-01-01 00:01:00 |  2    |  0    | 
2019-01-01 00:01:00 |  3    |  0    |
2019-01-01 00:02:00 |  1    |  2    |
2019-01-01 00:02:00 |  2    |  2    |
2019-01-01 00:02:00 |  3    |  1    |
2019-01-01 00:03:00 |  1    |  1    |
2019-01-01 00:03:00 |  2    |  2    |
2019-01-01 00:03:00 |  3    |  0    |
2019-01-01 00:04:00 |  1    |  1    |
2019-01-01 00:04:00 |  2    |  0    |
2019-01-01 00:04:00 |  3    |  0    |

Jon Spring · Answer 1 · 17 мая 2019

library(dplyr); library(padr)
df %>%
  pad(group = 'Group', interval = 'min') %>%   # Explicitly fill by 1 min
  fill_by_value(Value)

#pad applied on the interval: min
#              Datetime Group Value
#1  2019-01-01 00:00:00     1     5
#2  2019-01-01 00:01:00     1     1
#3  2019-01-01 00:02:00     1     2
#4  2019-01-01 00:03:00     1     1
#5  2019-01-01 00:04:00     1     1
#6  2019-01-01 00:00:00     2     4
#7  2019-01-01 00:01:00     2     0    # added
#8  2019-01-01 00:02:00     2     2
#9  2019-01-01 00:03:00     2     2
#10 2019-01-01 00:00:00     3     2
#11 2019-01-01 00:01:00     3     0    # added
#12 2019-01-01 00:02:00     3     1

Данные

df <- read.table(
  header = T,
  stringsAsFactors = F, sep = "|",
  text = "Datetime            | Group | Value
2019-01-01 00:00:00 |  1    |  5  
2019-01-01 00:00:00 |  2    |  4    
2019-01-01 00:00:00 |  3    |  2     
2019-01-01 00:01:00 |  1    |  1  
2019-01-01 00:02:00 |  1    |  2     
2019-01-01 00:02:00 |  2    |  2    
2019-01-01 00:02:00 |  3    |  1    
2019-01-01 00:03:00 |  1    |  1    
2019-01-01 00:03:00 |  2    |  2    
2019-01-01 00:04:00 |  1    |  1"
) 
df$Datetime = lubridate::ymd_hms(df$Datetime)

akrun · Answer 2 · 17 мая 2019

Мы можем использовать complete

library(tidyverse)
df %>%
   complete(Group, Datetime = seq(min(Datetime),
          max(Datetime), by = "1 min"), fill = list(Value = 0)) %>% 
   arrange(Datetime)  %>% 
   select(names(df))
# A tibble: 15 x 3
#   Datetime            Group Value
#   <dttm>              <dbl> <dbl>
# 1 2019-01-01 00:00:00     1     5
# 2 2019-01-01 00:00:00     2     4
# 3 2019-01-01 00:00:00     3     2
# 4 2019-01-01 00:01:00     1     1
# 5 2019-01-01 00:01:00     2     0
# 6 2019-01-01 00:01:00     3     0
# 7 2019-01-01 00:02:00     1     2
# 8 2019-01-01 00:02:00     2     2
# 9 2019-01-01 00:02:00     3     1
#10 2019-01-01 00:03:00     1     1
#11 2019-01-01 00:03:00     2     2
#12 2019-01-01 00:03:00     3     0
#13 2019-01-01 00:04:00     1     1
#14 2019-01-01 00:04:00     2     0
#15 2019-01-01 00:04:00     3     0

данные

df <- structure(list(Datetime = structure(c(1546300800, 1546300800, 
1546300800, 1546300860, 1546300920, 1546300920, 1546300920, 1546300980, 
1546300980, 1546301040), class = c("POSIXct", "POSIXt"), tzone = "UTC"), 
    Group = c(1, 2, 3, 1, 1, 2, 3, 1, 2, 1), Value = c(5, 4, 
    2, 1, 2, 2, 1, 1, 2, 1)), row.names = c(NA, -10L), class = "data.frame")

Pablo Rod · Answer 3 · 17 мая 2019

Использование base:

date_groups <- expand.grid(Datetime= seq(min(df$Datetime), max(df$Datetime), "min"), 
                           Group = c(1:3))

date_groups <- merge(date_groups, df, all.x = TRUE)
date_groups[is.na(date_groups)] <- 0

Как заполнить пропущенные даты поминутно по группе в R

Пожалуйста, войдите или зарегистрируйтесь чтобы ответить на этот вопрос.

Ответы [ 3 ]

Пожалуйста, войдите или зарегистрируйтесь что бы добавить комментарий.

данные

Пожалуйста, войдите или зарегистрируйтесь что бы добавить комментарий.

Пожалуйста, войдите или зарегистрируйтесь что бы добавить комментарий.

Как заполнить пропущенные даты поминутно по группе в R

Пожалуйста, войдите или зарегистрируйтесь чтобы ответить на этот вопрос.

Ответы [ 3 ]

Пожалуйста, войдите или зарегистрируйтесь что бы добавить комментарий.

данные

Пожалуйста, войдите или зарегистрируйтесь что бы добавить комментарий.

Пожалуйста, войдите или зарегистрируйтесь что бы добавить комментарий.

Похожие темы