объединить и суммировать data.frame в пределах допуска, используя один из столбцов - PullRequest
0 голосов
/ 09 апреля 2019

Я застрял с простым вопросом.Как объединить и обозначить числа в пределах установленного допуска (diff = + -0.002) в столбце ia и суммировать значения в столбце времен.

например

 ia<-c(1.001,1.002,2,2.2,1.1,1,1,1,2.5,1,2.8)
 time<-c(4.5,2.4,1.5,1.2,4.9,6.4,4.4, 4.7, 7.3,2.3, 4.3)
 a<-as.data.frame(cbind(ia, time))

       ia time
   1  1.001  4.5
   2  1.002  2.4
   3  2.000  1.5
   4  2.200  1.2
   5  1.100  4.9
   6  1.000  6.4
   7  1.000  4.4
   8  1.000  4.7
   9  2.002  7.3
   10 1.000  2.3
   11 2.800  4.3

   to 

       ia time
   1  1.001  24.7    #  ia = mean(1 2 6 7 8 10)   time = sum(1 2 6 7 8 10)
   3  2.001  9.7     #  ia = mean(2 9)   time = sum(2 9)
   4  2.200  1.2
   5  1.100  4.9
   11 2.800  4.3

Спасибо!

Ответы [ 2 ]

1 голос
/ 09 апреля 2019

Мне совершенно не понятно, что вы пытаетесь сделать, и примеры / объяснения, которые вы дали в комментариях, заставляют меня еще больше чесать голову.

Если оставить в стороне, возможно, следующеедостойная отправная точка для дальнейших уточнений.

Мы можем использовать cut для группировки значений в ia и затем суммировать значения ia и time по grp

diff = 0.002
library(dplyr)
a %>%
    mutate(grp = cut(ia, seq(min(ia), max(ia), by = diff), include.lowest = T)) %>%
    group_by(grp) %>%
    summarise(
        io = mean(ia),
        time = sum(time))
## A tibble: 6 x 3
#  grp            io  time
#  <fct>       <dbl> <dbl>
#1 [1,1.002]    1.00  24.7
#2 (1.098,1.1]  1.1    4.9
#3 (1.998,2]    2      1.5
#4 (2.198,2.2]  2.2    1.2
#5 (2.498,2.5]  2.5    7.3
#6 (2.798,2.8]  2.8    4.3
0 голосов
/ 09 апреля 2019

Одним из решений является создание фиктивной переменной группировки.К сожалению, по вашему вопросу трудно сказать, какую группу вы ищете.Хотя, основываясь на результатах вашей игрушки, я предполагаю, что вы хотите {(0, 1.1) [1.1, 2.01) [2.01, 2.2) [2.2, 2.8) [2.8, Inf)}?Если это так, вы можете использовать:

a$group <- ifelse(a$ia < 1.1, 0, 
   ifelse(a$ia >= 1.1 & a$ia < 2.01, 1, 
      ifelse(a$ia >= 2.01 & a$ia < 2.2, 2, 
         ifelse(a$ia >= 2.2 & a$ia < 2.8, 3, 4))))

Тогда вы можете использовать функции обратного хода проще

a %>% group_by(group) %>% summarize("ia" = mean(ia), "time" = sum(time))
Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...