Как заполнить вектор из цикла for, содержащего числовую последовательность с заданным шагом? - PullRequest
0 голосов
/ 29 октября 2018

У меня есть следующий фрагмент кода:

library(dplyr)

Q = 10000
span = 1995:2016
time = rep(span,times = Q, each= Q)
id = rep(1:Q,times=length(span))
s1 =  rep(rnorm(Q,0,1),times=length(span))
gdp = rep(rnorm(Q,0,1),times=length(span))
e = rep(rnorm(Q,0,1),times=length(span))
dfA = data.frame(id,time,s1,e,gdp)

mgr = double()
stp = 10
for(K in seq(10,Q,stp)){
  gr = double()
  for(t in span){
    wt1 = dfA %>% filter(time == t-1) %>%
      arrange(desc(s1)) %>% mutate(w= s1/gdp)
    zt1 = dfA %>% filter(time == t-1) %>% mutate(z1 = log(s1/e))
    zt = dfA %>% filter(time == t) %>% mutate(z = log(s1/e))
    gt = left_join(zt1,zt,by="name") %>%
      mutate(g = z-z1) %>% select(name,g) %>% na.omit()

    a = left_join(wt1,gt,by="name") %>% na.omit()
    a = a  %>% mutate(id = 1:length(a$name)) %>%
     filter(id <= Q) %>% mutate(gbar = mean(g)) %>%
     filter(id <= K) %>% mutate(sck = g-gbar, 
     gamma = w*sck)

     gr = append(gr, sum(a$gamma))
     }
mgr = append(mgr,mean(gr))
}

где dfA - фрейм данных, содержащий переменную id и переменную времени, среди прочих. Поскольку переменная времени находится в диапазоне от 1995 до 2016 года, а K - это последовательность с шагом 10, я прибегнул к append() для хранения gr и mgr соответственно. Проблема в том, что на вычисление уходит слишком много времени.

Итак, мой вопрос: есть ли способ избежать использования append() для заполнения векторов gr и mgr и, таким образом, сократить время, затрачиваемое на вычисление кода?

1 Ответ

0 голосов
/ 29 октября 2018

Вы можете инициировать векторы 'gr' и 'mgr' с заданной длиной, а не просто инициировать их как двойные, и R может расширять их на каждой итерации. Преимущество состоит в том, что память для вектора выделяется заранее, и вам не нужно переопределять всю переменную mgr / gr.

## initiate vectors with set length
mgr <- double(length = length(seq(10,Q,stp)))
gr <- double(length = length(1995:2016))

# fill the positions in each iteration
outerIteration <- (K - 10) / stp
innerIteration <- t - 1994
gr[innerIteration] <- sum(a$gamma)
# take the mean for each block of length 21 (2016 - 1995)
mgr[outerIteration] <- mean(gr[(outerIteraion -1)*21 + 1 : outerIteration*21])
Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...