Я получил ниже фрейм данных в R и нашел способ транспонировать его, но я хотел бы оптимизировать код.
Итак, мой фрейм данных такой:
EVENT NUMBER HOURS_PCT CYCLES_PCT
A23 -17 2 2
A23 -18 3 3
A23 -19 4 4
A23 -20 5 5
A23 -21 6 6
A23 -22 7 7
A23 -23 8 8
A23 -24 9 9
A23 -25 10 10
CD12 -1 11 11
CD12 -2 12 12
CD12 -3 13 13
CD12 -4 14 14
CD12 -5 15 15
CD12 -6 16 16
CD12 -7 17 17
Результаты точные и правильные и выглядят так:
EVENT <- c('A23','A23','A23','A23','A23','A23','A23','A23','A23','CD12','CD12','CD12','CD12','CD12','CD12','CD12')
NUMBER <-c('-17','-18','-19','-20','-21','-22','-23','-24','-25','-1','-2','-3','-4','-5','-6','-7')
HOURS_PCT <- seq(from=2, to=17, by=1)
CYCLES_PCT <- seq(from=2, to=17, by=1)
df <- data.frame(EVENT, NUMBER, HOURS_PCT, CYCLES_PCT)
df_1h <- df %>%
arrange(EVENT, NUMBER, HOURS_PCT) %>%
group_by(EVENT) %>% top_n(5,NUMBER) %>%
mutate(SEQ = row_number())
df_1c <- df %>%
arrange(EVENT, NUMBER, CYCLES_PCT) %>%
group_by(EVENT) %>% top_n(5,NUMBER) %>%
mutate(SEQ = row_number())
df_1h$NUMBER<-NULL; df_1h$CYCLES_PCT<-NULL
df_1c$NUMBER<-NULL; df_1c$HOURS_PCT<-NULL
df_1h_t <- spread(df_1h, SEQ, HOURS_PCT, fill = "")
df_1c_t <- spread(df_1c, SEQ, CYCLES_PCT, fill = "")
df_final <- cbind(df_1h_t,df_1c_t)
df_final$EVENT1<-NULL
Я нахожу это очень ручным и Интересно, можно ли это оптимизировать. Я пытался добавить сбор и распространение в мои команды конвейера, но они никогда не работали.