Использование фильтра dplyr с несколькими условиями - PullRequest
0 голосов
/ 09 мая 2020

У меня есть следующий набор данных.

Есть три столбца: Pentad, A и B.

library(zoo)
library(rlang)
library(tidyverse) 

dat<-structure(list(Pentad = 50:73, A = c(152.796, 
109.678, 91.5594,115.155, 135.9, 202.441, 71.6951, 
88.3894, 261.962,135.853, 89.3425, 110.674, 100.558, 
173.507, 87.2157, 86.6425, 75.1852, 57.403, 62.5705, 
49.6846, 52.0257, 92.819, 105.419, 97.7598), 
B = c(145.402, 110.109, 83.1076, 95.3952, 148.571, 
119.178, 56.5031, 76.2635, 260.443, 109.705, 62.3749, 
100.322, 88.4134, 135.721, 63.1486, 69.7161, 62.3886, 
46.4513, 52.4546, 42.7725, 45.7643, 79.5419, 79.9434, 
87.6405)), class = "data.frame", row.names = c(NA, 
-24L))

Я хотел бы реализовать следующее условие в R.

[1] V1 should be between 0 and 90 at the time step (excluding 0 and 90)

[2] In the succeeding FOUR time steps (including the 
timestep in [1]), V1 between 0 and 90 in AT LEAST THREE timesteps

То, что у меня есть на данный момент:

 test2 <- function(dat, column_name){ 
   dat %>%
   rownames_to_column() %>%
   filter((.data[[column_name]] > 0 & .data[[column_name]] < 90) & 
         rollsum(.data[[column_name]] > 0 & .data[[column_name]] < 90, 4, fill = NA, align = 
                   "left") >= 3) %>%
   slice(1) -> result
  return(result)
}

out <- colnames(dat2) %>% 
  set_names %>% 
  map_dfr(~ test2(dat2, .x), .id = 'Col_ID')

ПРОБЛЕМА:

Я хочу получить значение временного шага / пентады, при котором указанные выше три условия верны как для второго (столбец A) и третий столбец (столбец B).

То есть временной шаг, когда оба столбца удовлетворяют условиям одновременно.

Ожидаемый результат - Pentad 64.

Есть идеи, как я могу реализовать это в R?

Буду признателен за любую помощь.

1 Ответ

1 голос
/ 09 мая 2020

Вот попытка, очень близкая к попытке OP.

library(dplyr)
library(zoo)

test2 <- function(dat) {
   dat %>%
      filter_at(vars(A:B), all_vars(. > 0 & . < 90 & 
                     rollsum(. > 0 & . < 90, 4, fill = NA) >= 3)) %>%
       slice(1L)
}

test2(dat)

#  Pentad       A       B
#1     64 87.2157 63.1486
...