Question

У меня есть функция для экспоненциального сглаживания. Мне нужно применить это для временных рядов по группам. Вначале мне нужно установить фиксированные начальные значения, затем для каждого года функция вычисляет результаты, которые зависят от результата предыдущего года (или от начальных значений в первом году).

У меня довольно много данных, и скорость - главное. Так как это сделать с dplyr или tidyverse?

Приведенный ниже код работает, но только на основе initialValues.

library(tidyverse)
library(expm)

# Function:

f <- function(L1, L2, L3, L4, L5, A) {
 solve(A) %*% (expm(A) %*% (A %*% initialValues + c(L1, L2, L3, L4, L5)))
}

# Data:

df <- as_tibble(list(year = rep(2000:2002, 2), 
                 id = rep(letters[1:2], 3), 
                 L1 = sample(1:10, 6),     
                 L2 = sample(1:10, 6), 
                 L3 = sample(1:10, 6),        
                 L4 = sample(1:10, 6),        
                 L5 = sample(1:10, 6),
                 A = list(matrix(runif(25, 0, 1), ncol = 5),
                          matrix(runif(25, 0, 1), ncol = 5),
                          matrix(runif(25, 0, 1), ncol = 5),
                          matrix(runif(25, 0, 1), ncol = 5),
                          matrix(runif(25, 0, 1), ncol = 5),
                          matrix(runif(25, 0, 1), ncol = 5)
                          )))

initialValues <- c(5, 5, 6, 8, 9)

# Call:

final <- df %>%
  group_by(id) %>%
  mutate(result = pmap(list(L1, L2, L3, L4, L5, A), f))

Вышеприведенная функция f работает первый год, но в следующем году она должна выглядеть примерно так:

  solve(A) %*% (expm(A) %*% (A %*% dplyr::lag(result) + c(L1, L2, 
L3, L4, L5)))

OR

  solve(A) %*% (expm(A) %*% (A %*% result[i - 1] + c(L1, L2, L3, L4, 
L5)))

Но сама result не может быть указана таким образом внутри pmap.

РЕДАКТИРОВАТЬ: С помощью вспомогательных переменных и условного case_when в функции, я могу сослаться на предыдущее значение по группе id_nr, но это решение неуклюже. Есть идеи получше?

f1 <- function(id_nr, L1, L2, L3, L4, L5, A) {
  case_when(id_nr == 1 ~ solve(A) %*% (expm(A) %*% (A %*% initialValues 
+ c(L1, L2, L3, L4, L5))),
        TRUE ~ NA_real_ )
}

f2 <- function(id_nr, L1, L2, L3, L4, L5, A, onebefore) {
  case_when(id_nr == 2 ~ solve(A) %*% (expm(A) %*% (A %*% onebefore + 
c(L1, L2, L3, L4, L5))),
        TRUE ~ NA_real_ )
}

f3 <- function(id_nr, L1, L2, L3, L4, L5, A, onebefore) {
 case_when(id_nr == 3 ~ solve(A) %*% (expm(A) %*% (A %*% onebefore + 
c(L1, L2, L3, L4, L5))),
        TRUE ~ NA_real_ )
}

final <- df %>%
  group_by(id) %>%
  mutate(id_nr = 1:n(),
         result = pmap(list(id_nr, L1, L2, L3, L4, L5, A), f1),
         result2 = pmap(list(id_nr, L1, L2, L3, L4, L5, A, result[1]), f2),
         result3 = pmap(list(id_nr, L1, L2, L3, L4, L5, A, result2[2]), f3)
  ) %>%
   select(year, id, id_nr, result, result2, result3) %>%
   as.data.frame()

Дает:

# year id id_nr                                               result
# 1 2000  a     1  69.99273, 187.46908, 133.68695, 39.14645, 192.07844
# 2 2001  b     1 150.08891, 105.06450, 134.75766, 143.28060, 86.68116
# 3 2002  a     2                                   NA, NA, NA, NA, NA
# 4 2000  b     2                                   NA, NA, NA, NA, NA
# 5 2001  a     3                                   NA, NA, NA, NA, NA
# 6 2002  b     3                                   NA, NA, NA, NA, NA
# result2                                          result3
# 1                               NA, NA, NA, NA, NA                               
#NA, NA, NA, NA, NA
# 2                               NA, NA, NA, NA, NA                               
#NA, NA, NA, NA, NA
# 3 1630.093, 2488.520, 2012.516, 1407.798, 1377.609                               
#NA, NA, NA, NA, NA
# 4 1751.489, 1444.543, 1531.545, 1922.810, 1544.579                             
#NA, NA, NA, NA, NA
# 5                               NA, NA, NA, NA, NA 30153.83, 
#36416.09, 19069.84, 18595.81, 31028.20
# 6                               NA, NA, NA, NA, NA 22072.69, 
#22904.23, 20731.95, 14812.70, 18054.79

(мне все еще нужно объединить столбцы result, result2, result3.)

Рекурсивный цикл с dplyr :: group_by

Пожалуйста, войдите или зарегистрируйтесь чтобы ответить на этот вопрос.

Ответы [ 0 ]

Рекурсивный цикл с dplyr :: group_by

Пожалуйста, войдите или зарегистрируйтесь чтобы ответить на этот вопрос.

Ответы [ 0 ]

Нет похожих вопросов