Как убрать хвост с NA в р? - PullRequest
3 голосов
/ 10 апреля 2019

У меня есть вектор:

a<-c(NA,1:5,NA,NA,1:3, rep(NA,round(runif(1,0,100))))

И мне нужно убрать хвост с помощью NA.
В итоге результат будет:

c(NA,1:5,NA,NA,1:3)

Ответы [ 6 ]

3 голосов
/ 10 апреля 2019

Вы можете сделать

a[1:max(which(!is.na(a)))]
# [1] NA  1  2  3  4  5 NA NA  1  2  3

Мы подставим вектор из позиции 1 в последнее не значение NA.

2 голосов
/ 10 апреля 2019

Один вариант будет

a[rev(cumprod(rev(is.na(a)))) == 0]
# [1] NA  1  2  3  4  5 NA NA  1  2  3

Вот шаги:

(a <- c(NA, 1:5, NA, NA, 1:3, NA, NA))
# [1] NA  1  2  3  4  5 NA NA  1  2  3 NA NA
is.na(a)
# [1]  TRUE FALSE FALSE FALSE FALSE FALSE  TRUE  TRUE FALSE FALSE FALSE  TRUE  TRUE
rev(is.na(a))
# [1]  TRUE  TRUE FALSE FALSE FALSE  TRUE  TRUE FALSE FALSE FALSE FALSE FALSE  TRUE
cumprod(rev(is.na(a)))
# [1] 1 1 0 0 0 0 0 0 0 0 0 0 0
rev(cumprod(rev(is.na(a))))
# [1] 0 0 0 0 0 0 0 0 0 0 0 1 1
1 голос
/ 10 апреля 2019

Также возможна:

a[cumsum(!is.na(a)) != max(cumsum(!is.na(a))) * is.na(a)]

 [1] NA  1  2  3  4  5 NA NA  1  2  3

В отдельных шагах:

is.na(a)

 [1]  TRUE FALSE FALSE FALSE FALSE

cumsum(!is.na(a))

 [1] 0 1 2 3 4

cumsum(!is.na(a)) != max(cumsum(!is.na(a)))

 [1]  TRUE  TRUE  TRUE  TRUE  TRUE

cumsum(!is.na(a)) != max(cumsum(!is.na(a))) * is.na(a)

 [1]  TRUE  TRUE  TRUE  TRUE  TRUE

Просто для удовольствия, небольшой тест:

library(microbenchmark)

a <- rep(a, 1e5)

 microbenchmark(
 markus = a[1:max(which(!is.na(a)))],
 Julius_Vainora = a[rev(cumprod(rev(is.na(a)))) == 0],
 Kim = rm_NA_tail(a),
 tmfmnk = a[cumsum(!is.na(a)) != max(cumsum(!is.na(a))) * is.na(a)],
 nsinghs = a[1:(length(a) - rle(is.na(rev(a)))$lengths[1])],
 times = 5
)

Unit: milliseconds
           expr      min       lq     mean   median       uq       max neval cld
         markus 150.7346 153.0674 156.4194 153.3031 159.4718  165.5201     5 a  
 Julius_Vainora 393.8520 418.8186 616.3269 703.4022 749.6600  815.9018     5  bc
            Kim 370.7680 382.1826 536.0828 632.0031 642.1882  653.2720     5  bc
         tmfmnk 390.2626 415.2378 466.4245 415.8310 423.3828  687.4082     5  b 
        nsinghs 537.0404 781.1403 798.6929 793.1027 842.6777 1039.5033     5   c
1 голос
/ 10 апреля 2019

Вы можете найти максимальную позицию, которая не является NA и поднабором соответственно

> a[1:max(which(!is.na(a)))]
 [1] NA  1  2  3  4  5 NA NA  1  2  3
0 голосов
/ 10 апреля 2019

Это можно сделать с помощью rle()

a[1:(length(a) - rle(is.na(rev(a)))$lengths[1])]
#  [1] NA  1  2  3  4  5 NA NA  1  2  3

rle(is.na(rev(a)))$lengths[1] получает количество завершающих NA в векторе, затем вычитает его из общего вектора length, чтобы получить индекс, до которого вы хотите сохранить вектор.

0 голосов
/ 10 апреля 2019

Я думаю, что это работает:

rm_NA_tail <- function(a) {
  if (is.na(a[length(a)])) {
    return(a[is.na(match(data.table::rleid(a), max(data.table::rleid(a))))])
  } else {
    return(a)
  }
}
Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...