Последнее наблюдение перенесено (LOCF) для всех NA в R - PullRequest
0 голосов
/ 02 марта 2020

Я бы хотел, чтобы все значения NA были заменены методом Last Carried Forward (LOCF) в R. У меня есть следующий набор данных:

Value1        Value2           Value3          Group
100           56               82              Group1
150           NA               97              Group2
NA            66               NA              Group3
120           NA               NA              Group4

Я хотел бы создать следующие данные set:

Value1        Value2           Value3          Group
100           56               82              Group1
150           56               97              Group2
150           66               97              Group3
120           66               97              Group4

Любая идея о том, как это сделать, будет принята с благодарностью.

Ответы [ 2 ]

6 голосов
/ 02 марта 2020
foo = function(x) {
    x[cummax((!is.na(x)) * seq_along(x))]
}

data.frame(lapply(df, foo))

Если первый элемент также может быть NA, используйте следующую функцию

foo = function(x) {
    x[cummax(pmax(1, (!is.na(x)) * seq_along(x)))]
}
4 голосов
/ 02 марта 2020

Вы можете использовать fill из tidyr.

tidyr::fill(df, everything())

#  Value1 Value2 Value3  Group
#1    100     56     82 Group1
#2    150     56     97 Group2
#3    150     66     97 Group3
#4    120     66     97 Group4

Или с zoo::na.locf

df[] <- lapply(df, zoo::na.locf)

данные

df <- structure(list(Value1 = c(100L, 150L, NA, 120L), Value2 = c(56L, 
NA, 66L, NA), Value3 = c(82L, 97L, NA, NA), Group = structure(1:4, 
.Label = c("Group1", "Group2", "Group3", "Group4"), class = "factor")), 
class = "data.frame", row.names = c(NA, -4L))
...