Удалить строки с нулевым значением при условии - PullRequest
0 голосов
/ 20 сентября 2018

У меня есть фрейм данных:

dt <- read.table(text = "
350 16 
366 11 
376  0
380  0
397  0
398 45  
400 19  
402 0
510 0
525 0
537 0
549 0
569 112
578 99")

Я хочу удалить все строки с нулем во втором столбце, кроме строки до и после ненулевого значения.

Результатбудет:

dt1 <- read.table(text = "
350 16 
366 11 
376  0
397  0
398 45  
400 19  
402 0
549 0
569 112
578 99")

Ответы [ 4 ]

0 голосов
/ 21 сентября 2018

Это не является чем-то новым по сравнению с другими ответами, но я нашел вопрос интересным, и поэтому я нашел свое собственное решение - voilá:

## Function to test if both neighbors of a vector element have the value 0
## Returns a logical vector.
neighbors_zero <- function(x) {
  ## left neighbor is zero?
  rn0 <- c(x[2:length(x)], x[1]) == 0
  ## right neighbor is zero?
  ln0 <- c(x[length(x)], x[1:(length(x)-1)]) == 0
  return(rn0 & ln0)
}

## Test if a value is itsself zero and between other zeros
zero_between_zeros <- dt$V2 == 0 & neighbors_zero(dt$V2)

dt[!zero_between_zeros, ]
0 голосов
/ 20 сентября 2018

Простое решение с использованием base R сравнения смещенных вверх и вниз векторов

dt[ !(c(dt$V2[-1],0) == 0 & c(0,dt$V2[-length(dt$V2)]) == 0 & dt$V2 == 0), ]
0 голосов
/ 20 сентября 2018

Используя dplyr:

dt %>%
  filter(lag(V2, 1) != 0 | lead(V2, 1) != 0 | V2 != 0)

    V1  V2
1  350  16
2  366  11
3  376   0
4  397   0
5  398  45
6  400  19
7  402   0
8  549   0
9  569 112
10 578  99

Или:

dt %>%
  group_by(cond = lag(V2, 1) != 0 | lead(V2, 1) != 0 | V2 != 0) %>%
  filter(cond == TRUE) %>%
  ungroup() %>%
  select(-cond)

# A tibble: 10 x 2
      V1    V2
   <int> <int>
 1   350    16
 2   366    11
 3   376     0
 4   397     0
 5   398    45
 6   400    19
 7   402     0
 8   549     0
 9   569   112
10   578    99
0 голосов
/ 20 сентября 2018
library(data.table)
setDT(dt)

dt[{n0 <- V2 != 0; n0 | shift(n0) | shift(n0, type = 'lead')}]
#or
dt[(n0 <- V2 != 0) | shift(n0) | shift(n0, type = 'lead')] # thanks @Frank

#      V1  V2
#  1: 350  16
#  2: 366  11
#  3: 376   0
#  4: 397   0
#  5: 398  45
#  6: 400  19
#  7: 402   0
#  8: 549   0
#  9: 569 112
# 10: 578  99

Редактировать:

Теперь, когда data.table::shift принимает векторы с некоторыми отрицательными и некоторыми положительными элементами, вы можете использовать приведенный ниже код вместо

dt[Reduce('|', shift(V2 != 0, -1:1))]
Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...