R - Как использовать накопленную сумму по годам и перезапустить накопленную сумму при выполнении условия - PullRequest
0 голосов
/ 05 июня 2018

У меня есть следующий фрейм данных в R:

  YEAR DOY   PRECTOT cumsum Lws   prec0
   <int> <chr>   <dbl>  <dbl> <chr> <chr>
 1  1982 121    6.05     6.05 no    no   
 2  1982 122    1.10     7.15 no    no   
 3  1982 123    0.490    7.64 no    no   
 4  1982 124    4.53    12.2  no    no   
 5  1982 125    3.94    16.1  no    no   
 6  1982 126    2.78    18.9  no    no   
 7  1982 127    0.420   19.3  no    no   
 8  1982 128    0.      19.3  no    yes  
 9  1982 129    0.0700  19.4  no    no   
10  1982 130    8.94    28.3  no    no 

Я хочу другой столбец, который вычисляет накопленную сумму, как в столбце cumsum, но затем возобновляет подсчет, когда PRECTOT равен 0, например, в строке 8.По сути, он должен перезапустить накопительную сумму из строки 8 и продолжить накопленную сумму оттуда, как так:

  YEAR DOY   PRECTOT cumsum Lws   prec0
   <int> <chr>   <dbl>  <dbl> <chr> <chr>
 1  1982 121    6.05     6.05 no    no   
 2  1982 122    1.10     7.15 no    no   
 3  1982 123    0.490    7.64 no    no   
 4  1982 124    4.53    12.2  no    no   
 5  1982 125    3.94    16.1  no    no   
 6  1982 126    2.78    18.9  no    no   
 7  1982 127    0.420   19.3  no    no   
 8  1982 128    0.      0  no    yes  
 9  1982 129    0.0700  0.0700  no    no   

Есть ли хороший и эффективный способ для этого в R?Спасибо.

Ответы [ 2 ]

0 голосов
/ 05 июня 2018

Вот один из способов перезапустить накопленную сумму при выполнении условия, используя data.table:

dat <- read.table(header = TRUE, text = "YEAR DOY   PRECTOT cumsum Lws   prec0
1982 121    6.05     6.05 no    no
1982 122    1.10     7.15 no    no
1982 123    0.490    7.64 no    no
1982 124    4.53    12.2  no    no
1982 125    3.94    16.1  no    no
1982 126    2.78    18.9  no    no
1982 127    0.420   19.3  no    no
1982 128    0.      19.3  no    yes
1982 129    0.0700  19.4  no    no
1982 130    8.94    28.3  no    no")

library(data.table)
dat <- data.table(dat)
dat[, NEWCOL:=cumsum(PRECTOT), by=cumsum(PRECTOT==0)]

Совокупная сумма перезапускается с использованием группы data.table на (by=cumsum(<condition>)).

0 голосов
/ 05 июня 2018

«Перезапуск при выполнении условия» выполняется с помощью group_by(cumsum(<condition>)):

library(dplyr)

dat %>% 
  group_by(grp = cumsum(PRECTOT == 0)) %>% 
  mutate(cumsum = cumsum(PRECTOT))

# # A tibble: 10 x 7
# # Groups:   grp [2]
#     YEAR DOY   PRECTOT cumsum Lws   prec0   grp
#    <int> <chr>   <dbl>  <dbl> <chr> <chr> <int>
#  1  1982 121      6.05   6.05 no    no        0
#  2  1982 122      1.1    7.15 no    no        0
#  3  1982 123      0.49   7.64 no    no        0
#  4  1982 124      4.53  12.2  no    no        0
#  5  1982 125      3.94  16.1  no    no        0
#  6  1982 126      2.78  18.9  no    no        0
#  7  1982 127      0.42  19.3  no    no        0
#  8  1982 128      0      0    no    yes       1
#  9  1982 129      0.07   0.07 no    no        1
# 10  1982 130      8.94   9.01 no    no        1

Данные:

dat <- readr::read_table2(
"YEAR DOY   PRECTOT cumsum Lws   prec0
1982 121    6.05     6.05 no    no
1982 122    1.10     7.15 no    no
1982 123    0.490    7.64 no    no
1982 124    4.53    12.2  no    no
1982 125    3.94    16.1  no    no
1982 126    2.78    18.9  no    no
1982 127    0.420   19.3  no    no
1982 128    0.      19.3  no    yes
1982 129    0.0700  19.4  no    no
1982 130    8.94    28.3  no    no
", col_types = "icddcc")
Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...