Удаление группы с условным оператором в r - PullRequest
1 голос
/ 25 апреля 2020

Условный оператор состоит в том, что в любом случае, если есть две или более последовательных строки со значениями, превышающими 1, группа должна быть удалена.

Например:

Event<- c(1,1,1,1,2,2,2,2,2,2,3,3,3,3,3)
Value<- c(1,0,0,0,8,7,1,0,0,0,8,0,0,0,0)
A<- data.frame(Event, Value)

Event   Value
  1       1
  1       0
  1       0
  1       0
  2       8
  2       7
  2       1
  2       0
  2       0
  2       0
  3       8
  3       0
  3       0
  3       0
  3       0

В этом примере группа события 2 должна быть удалена, потому что она имеет две последовательные строки со значениями больше 1. Поэтому она должна выглядеть следующим образом:

Event   Value
  1       1
  1       0
  1       0
  1       0
  3       8
  3       0
  3       0
  3       0
  3       0

Любое предложение?

Ответы [ 3 ]

1 голос
/ 25 апреля 2020

A base R подход:

# split the dataframe by event into separate lists, record whether values are > 1 (T/F)
A_split <- split(A$Value > 1, Event)

# for each item in the list, record the number of consecutive T values;
# make T/F vector "keep" with row names corresponding to A$Event
keep <- sapply(A_split, function(x) sum(x[1:length(x) - 1] * x[2:length(x)])) == 0 

# convert keep to numeric vector of A$Event values
keep <- as.numeric(names(keep == T))

# subset A based on keep vector
A[A$Event %in% keep, ]

1 голос
/ 25 апреля 2020

Мы можем использовать rle по группам.

library(dplyr)
A %>%
 group_by(Event) %>%
 filter(!any(with(rle(Value > 1), lengths[values] > 1)))
 #Opposite way using all
 #filter(all(with(rle(Value > 1), lengths[values] < 2)))

#  Event Value
#  <dbl> <dbl>
#1     1     1
#2     1     0
#3     1     0
#4     1     0
#5     3     8
#6     3     0
#7     3     0
#8     3     0
#9     3     0

Те же логики c могут использоваться в базе R:

subset(A, !ave(Value > 1, Event, FUN = function(x) 
               any(with(rle(x), lengths[values] > 1))))

, а также data.table

library(data.table)
setDT(A)[, .SD[!any(with(rle(Value > 1), lengths[values] > 1))], Event]
1 голос
/ 25 апреля 2020

Использование dplyr

A %>%
  group_by(Event) %>%
  mutate(consec = if_else(Value > 1, row_number(), 0L),
         remove = if_else(consec > 1,"Y","N")) %>%
  filter(!any(remove == "Y")) %>%
  select(-c("consec","remove"))
Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...