применить очень конкретную функцию к каждому уровню фактора в кадре данных в R - PullRequest
1 голос
/ 29 марта 2019

Я хотел бы понять, что я делаю неправильно, применяя эту конкретную функцию к моему фрейму данных.

Запрошенные библиотеки

library(dplyr)
library(magrittr)
library(lubridate)

Прежде всего, фрейм данных

t1<-c("2009_01_01 09:00:00","2009_01_01 09:01:00","2009_01_01 09:02:00","2009_01_01 09:03:00","2009_01_01 09:04:00","2009_01_01 09:05:00")
t2<-c("2009_01_01 09:00:00","2009_01_01 09:01:00","2009_01_01 09:02:00")
S1<-cbind("A",t1)
S2<-cbind("B",t2)
datat<-data.frame(rbind(S1,S2))
datat$N<-"NA"
colnames(datat)<-c("trap","time","N")
datat$time<-as.POSIXct(datat$time, "%Y_%m_%d %H:%M:%S",tz="")
listdataset<-split(datat,datat$trap)
trap<-names(listdataset)
listdataset <- lapply(seq_along(listdataset), function(x) as.data.frame(listdataset[[x]]))
names(listdataset)<-trap
list2env(listdataset, envir = .GlobalEnv)

Затем конкретная функция (обратите внимание, что она была разработана членом этого сообщества, к сожалению, я не помню его / ее имени и поэтому прошу прощения за то, что не предоставил правильную оценку его / ее работе)который был разработан для одного кадра данных.Он был «слегка» изменен мной (в исходной версии я назвал набор данных) для этой конкретной цели.event_count <- function(ref_time){ min(i %>% filter(time %within% interval(ref_time - 60*5, ref_time)) %>% nrow, 10) }

Мой ожидаемый результат -

datat$N<-c(1,2,3,4,5,6,1,2,3)
datat
 trap        time         N
 1    A 2009-01-01 09:00:00 1
 2    A 2009-01-01 09:01:00 2
 3    A 2009-01-01 09:02:00 3
 4    A 2009-01-01 09:03:00 4
 5    A 2009-01-01 09:04:00 5
 6    A 2009-01-01 09:05:00 6
 7    B 2009-01-01 09:00:00 1
 8    B 2009-01-01 09:01:00 2
 9    B 2009-01-01 09:02:00 3

То, что я смог сделать до сих пор, не дает ожидаемого результата.

for (i in listdataset) { 
i %<>%   
rowwise() %>% 
mutate(N = event_count(time)) %>% 
arrange(time)
}

i
A tibble: 3 x 3
trap      time                  N
<fct>    <dttm>              <dbl>
1 B     2009-01-01 09:00:00     1
2 B     2009-01-01 09:01:00     2
3 B     2009-01-01 09:02:00     3

Что яя делаю не так?Любой совет будет очень признателен!Из моего вывода я понял, что оценивается только второй элемент цикла.Как оценить и первый элемент?

1 Ответ

1 голос
/ 29 марта 2019

Это решит вашу проблему:

event_count <- function(i,ref_time){
  min(i %>% filter(time %within% interval(ref_time - 60*5, ref_time)) %>% nrow, 10)
}

newData <- bind_rows(lapply(listdataset,function(i){i %>%   
    rowwise() %>% 
    mutate(N = event_count(i,time)) %>% 
    arrange(time)}))

...