Как рассчитать переменную, используя запаздывающее значение, используя R - PullRequest
1 голос
/ 13 марта 2020

Предположим, у меня есть простой набор данных

df <- data.frame(id=c("A","B","C","D","E","F"),
                 value=c(1,NA,NA,NA,NA,NA))

Я хочу перекодировать значение (или создать новую переменную), чтобы каждое последующее значение было равно предыдущему значению * 2 + предыдущее значение.

| id | value |
|----|-------|
| A  | 1     |
| B  | 3     |
| C  | 9     |
| D  | 27    |
| E  | 81    |
| F  | 243   |

Я думал, что смогу сделать это, используя лаг:

df <- df %>%
  mutate(value=(lag(value)*2)+lag(value))

Но это не сработало. Поэтому вместо этого я использовал для l oop

for (i in 2:nrow(df)){
  df[I,"value"] <-(df[i-1,"value"]*2)+df[i-1,"value"]
}

Это работает, но кажется не элегантным. Есть ли лучший способ сделать это с помощью соглашения / инструментов Tidyverse?

Ответы [ 2 ]

2 голосов
/ 13 марта 2020

Мы можем использовать accumulate из purrr

library(dplyr)
library(purrr)
df %>% 
     mutate(value = accumulate(value, ~ .x * 2 + .x))
#  id value
#1  A     1
#2  B     3
#3  C     9
#4  D    27
#5  E    81
#6  F   243

или более компактно

df %>%
     mutate(value = accumulate(value, ~ .x* 3))

или в base R с Reduce

Reduce(function(x, y)  x * 2 + x, df$value, accumulate = TRUE)
#[1]   1   3   9  27  81 243
1 голос
/ 13 марта 2020

Мы можем использовать accumulate из purrr:

library(dplyr)

df %>%
  mutate(value = purrr::accumulate(value[-n()], ~.x * 2 + .x, 
                .init = first(value)))

#  id value
#1  A     1
#2  B     3
#3  C     9
#4  D    27
#5  E    81
#6  F   243

Что можно сделать аналогичным образом в базе R, используя Reduce

Reduce(function(x, y) x * 2 + x, df$value[-nrow(df)], init = df$value[1], 
       accumulate = TRUE)
#[1]   1   3   9  27  81 243
Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...